全球最大中文网页搜索、MP3免费下载、图片搜索、新闻搜索平台

 

 

·收藏本站
·网站推广
·如何访问

   首 页 - 搜索引擎 - 中国网址之家 - MP3音乐 - 图片 - 搜索教程 - 搜索工具 - 网站推广服务
 

分类搜索引擎:分类搜索的方法与途径

http://www.sowang.com  2004-08-07  作者 邢志宇


    分类搜索引擎与关键词搜索引擎有着不同的功能、不同的用途和不同的检索方法,也有着各自的优势和弊端。我们根据不同的搜索目的,选择不同类型的搜索引擎。一般来说,分类搜索引擎常用于族性检索,适合查询具有同一特征的多个目标和主题范围广、概念宽泛的问题,而关键词搜索引擎的特性检索功能更为突出,多用于查询主题范围狭小而不甚明了的信息和交叉性、细节性问题。

1.逐级浏览,渐近目标
    分类逐级浏览是分类搜索引擎最基本的检索功能,它不用考虑关键词准确与否,无需构建检索式,使用方法简单,符合人们的思维和查询习惯。分类逐级浏览检索首先要熟悉分类体系,确定所需资料的大类归属,“即类以求”、“顺藤摸瓜”,逐步缩小查找范围,直至达到检索目的。

    如在Yahoo查找“New York Times”(《纽约时报》),首先确定它属于“News & Media(新闻与媒体)”大类,按照其类目结构,在其下位类中,依次Newspapers(报纸)--By Region(按地区查找)--U.S. States(美国)--New York(纽约)--Complete List(完全列表)逐级浏览,New York Times按字顺排列在Complete List之中。在搜狐中查找“中国人民保险公司河南省分公司”,从地域属性入手,按照“国家与地区--河南--公司企业--金融/投资--保险”的顺序,一检即得。

    为方便查找,搜索引擎对一些交叉学科、总论性或多属性类目等从不同的角度进行重复揭示,采用设置交替类目,以@符号标识、指示的方法(新浪等少数搜索引擎,虽设置交替类目,但无@标识符号),尽可能提供适合网民查找习惯的多种检索入口。

    上例查找“New York Times”是从内容性质入手,我们还可从其地域特征,按
“Regional--U.S. States--New York--News and Media--Complete List@”的路径得到同样结果。同样,搜狐除了“国家与地区”大类之外,还可以从“公司企业--金融/投资--保险按地区分类--河南@”、“工商经济--金融/投资--保险--保险公司@”、“社会科学--经济学--金融/投资/保险@”等路径找到“中国人民保险公司河南省分公司”的网站。

    了解分类体系及其类目涵义,准确判断查询目标在分类体系中的类目归属,是有效利用分类搜索引擎的前提,但由于搜索引擎没有统一的分类标准,类目的隶属关系不尽合理,横向关系交叉、重复,分类深度不一,类名缺乏准确性等固有弊端,希望普通用户都能熟悉庞大的类目体系及其复杂多变的结构,准确把握检索路径是不现实的。为此,分类搜索引擎大多采用智能搜索技术(如Yahoo采用OpenText公司先进的检索软件,搜狐采用自主开发的中文分词、模糊检索技术),提供关键词检索功能。

2.使用关键词,检索目录数据库
    关键词检索与逐级分类浏览是相辅相成的,是分类搜索引擎不可分割的两种功能。较为成熟和知名的分类搜索引擎(如Yahoo、搜狐等)都提供“Directory”、“类目”或“网站”的关键词检索途径,在各级类目可以随时使用关键词检索功能,对其分类数据库进行检索。

    在Yahoo分类检索首页(http://dir.yahoo.com)和各级类目检索页面分别有“the Directory(在目录中检索)”和“just this category(仅在此类中检索)”检索选项。搜狐分类检索首页(http://dir.sohu.com)
及各级类目检索页面的关键词检索,均默认为分类数据库检索,在“网页”、“新闻”等检索页面,点选“网站”标签,即可切换到分类检索。

    如在Yahoo中查找有关在中国旅游的资料或信息,在分类检索首页的检索框输入“Travel+China”或“Travel in China”,选择“the Directory”检索,结果首先序列“RELATED DIRECTORY CATEGORIES(相关类目)”的全部22条检索路径,然后分页显示数据库中与关键词匹配的570个网站列表。查找境外中国古典诗词的资料,通常从“Arts & Humanities(艺术与人文科学)”大类入手逐级查找,但其“Literature(文学)”类目下子目过多,难以选择最佳浏览路径,此时点选举“just this category”,用关键词“classical Chinese Poetry”检索,就会方便、快捷地找到相关网站。

    又如,在搜狐中如果仅从“国家与地区”或“教育/培训”两个常用路径查找有关图书馆的网站,肯定会造成许多专业和特殊类型图书馆的漏检,如果以“图书馆”为关键词在分类数据库中检索,就会发现,相关网站还分散在“科学/技术>工程技术”、“社会科学>报刊/杂志>CSSCI文献源”、“社会科学>汉学研究>参考资料”、“社会科学>信息管理>开发/服务>数字图书馆”、“卫生与健康>资料/文献>图书馆”等路径的相关类目之中,而这些路径和类目对于非专业人士来说是难以预料的。

    由于受对分类体系熟悉程度的限制,我们在检索前不可能预料所有相关的类目及其路径,这时如果使用关键词直接在目录数据库中检索,便可以提高检索效率,快速获得全部相关网站的结果列表。然而,关键词检索又受分类数据库人工标引及其规范化自然语言的制约,关键词的确切与否决定着检索结果的查准率,因此,如何选择关键词、运用布尔逻辑符与熟悉分类体系及其类目结构一样,是每个分类搜索引擎的使用者必须面对的问题。

    随着互联网的快速发展,全文搜索引擎已经实现了智能化和个性化,自动搜索技术和检索算法不断更新换代,其强大的检索功能加之沸沸扬扬的商业炒作,几乎使人们忽略了分类搜索引擎的存在与价值。然而,分类搜索引擎坚持以人工收录、标引和摘要网络资源的独特优势是全文搜索引擎无法替代的,它方便、实用的主题目录、具有特色的分类体系、精当扼要的网站简介,以及永远鲜活有效的链接,无不体现出智慧光彩和人文关怀,使完全依赖自动程序的全文搜索引擎难以望其项背。当然,由于分类体系主要是由人工构建的,分类搜索引擎难免存在诸如分类标准不统一、反映网站信息不及时、运营成本过高等固有弊端,也正是因为这些弊端,使它至今仍甩不掉“第一代搜索引擎”的标签。分类搜索引擎的发展和走向成熟,还需借鉴和采用自动分类、自动标引、自动文摘、智能检索等技术,在保持传统特色和优势的基础上提高自动化、智能化水平,提供更为全面、更加强大的功能与服务。
 


 

Copyright © SoWang.com.All Rights Reserved
中文搜索引擎指南网
 版权所有