全球最大中文网页搜索、MP3免费下载、图片搜索、新闻搜索平台

 

 

·收藏本站
·搜索论坛
·搜索工具

   首 页 - 搜索引擎目录 - 搜索入门到精通 - 中国网址之家 - 搜索引擎营销 - 搜索爱好者论坛
 

搜索结果的评价

http://www.sowang.com  2006-07-30 作者邢志宇


     搜索结果评价是对搜索结果价值的评判和对搜索结果进行去粗取精、去伪存真的甄别和筛选。搜索结果评价不同于网络资源评价。前者仅仅是对相关搜索结果的价值进行评判,用于指导搜索者在已有的结果列表中选择和利用具有准确性、可靠性、权威性的较高质量的特定结果; 而后者则着重对网络资源的整序,按照一定的标准对相关资源进行评价、标引和组织,目的是方便特定网络资源的公共利用。
 

    在网络搜索实践中,我们通常从结果来源和信息出处两个方面,对搜索结果进行评价和选择。
 
    1、结果来源

    结果来源是指相关的搜索结果是使用何种类型的搜索工具获得的,即结果的途径来源。利用不同的搜索工具得到的结果,其质量和可信度等级明显不同。总的来说,分类搜索工具的结果优于关键词形式匹配的搜索结果。

     各学科专家、学者和图书情报人员编制的分类目录、主题索引、专题指南等检索工具,从收录范围(Scope)、准确性(Accuracy)、权威性(Authority)、新颖性(Currency)、独特性(Uniqueness)、可靠性(Reliability)、链接(Links)等方面对网络资源进行评价、标引和介绍,所收录的资源具有较高的质量保障。与之相反,基于索引程序的搜索引擎的搜索结果由查询串的形式匹配产生,网页摘要为自动生成,结果排序由算法控制,在充分体现“客观反映”的同时,也给结果的甄别和选择带来一的困难。尽管“网页级别(PageRank)”(如Google等)的排序算法对搜索结果有一定的评价和推荐作用,但它只是链接指向的机械计算,不能从内容评价的角度影响人们对搜索结果的取舍决定。

    使用分类搜索工具,实际上是在利用专家、学者对网络资源整序的智力劳动成果。因此,在分类搜索工具的结果中,我们可以很容易地通过类目性质和网站介绍对某一资源的内容和适用程度做出明确的评价和判断。但是,对于搜索引擎完全形式匹配的搜索结果,则需要花费更多的时间和精力对其内容进行比较和验证,以保证最终采用结果的准确和适用。例如,查找“百度”收录网页的数量,用检索式“百度 收录 网页 亿”搜索,有“百度收录的中文网页超过6亿”、“在差不多20亿中文网页中,百度索引库中搜集了8亿”、“全球首个中文网页收录量达到10亿的搜索引擎”等不同的结果,到底哪个为最新和最准确的结果,我们需要利用新闻搜索进行时间验证,以找出最新的数据;还有必要使用英文搜索(如“baidu's web pages millions”、“baidu index web pages millions”等),从国外评价和第三方测试数据中进行验证,以找到令人信服的事例。

     2、信息出处

     信息出处是指信息的原始出处,即信息的最初发布者。信息发布者的权威性与信息的可信度有着直接的联系。从原始出处判断信息的可靠性是搜索结果评价的重要方法。

     信息的出处不同,表现出不同的质量权重。一般来说,来源于官方和专业网站的信息的权威性要远远高于BBS、BLOG、和商业网站,原发信息的可靠性要远远高于转载和引用信息。

     在网络搜索中存在一个普遍的现象,即一次搜索输出的不同的相关网页,由于宣传、推荐、转载、引用等,可能包含着相同或相似的内容,但它们的原始出处却只有一个,而只有来源于原始出处的信息才有足够的质量保障。例如,查找2005年7月4日美国宇航局(NASA)对坦普尔一号彗星进行“深度撞击”的图片和资料,使用“Deep Impact NASA”、“Deep Impact Gallery”等检索式搜索,均有数以十万计的相关结果,仅前两个页面的搜索结果就分别来自十多个不同的网站。通过对不同网站相关结果的分析可以看出,它们均为经过整理和重新编辑的NASA图片和资料,根据信息出处的评价原则,我们应优先采用NASA网站发布的信息和图片。 

     参与讨论>>


 

Copyright © SoWang.com.All Rights Reserved
中文搜索引擎指南网
 版权所有