请选择 进入手机版 | 继续访问电脑版

中文搜索引擎指南网

 找回密码
 禁止注册

QQ登录

只需一步,快速开始

搜索
查看: 9363|回复: 0

陈沛:从搜索引擎到新一代个人门户

[复制链接]
发表于 2006-9-18 16:40:32 | 显示全部楼层 |阅读模式



   第一代搜索引擎是目录分类式的。人们用人工的方法将互联网上各式各样的网站根据它的主要属性,比如新闻、电子商务、游戏、财经、体育等等分门别类地罗列出来,供人们查找使用。虽然有一些公司如GoTo.com、Lycos、Excite都在从事类似的搜索服务,但第一代搜索引擎的代表是1996年的雅虎,后来它成为了一个综合性的门户网站,成为互联网的一座丰碑。



    2004年8月,一个新的搜索引擎公司在纳斯达克上市,一年后它的市值是雅虎市值的两倍还多,它就是Google。Google采用了与雅虎完全不同的方法为互联网建立新的索引。用户只要输入相应的关键词就可以得到与关键词相关的任何一个网页,这就是第二代搜索引擎。它用技术而非人工的方法以关键词为中心建立了新的索引体系,有效快捷地帮助人们直达所需内容本身。


    2003年8月20日,我在“搜索的智慧”的新闻发布会上正式提出了第三代搜索引擎的概念。2004年8月搜狐提出了第三代互动搜索;2004年12月,中搜推出网络猪3.0,称其为第三代搜索引擎、个性化信息门户,网络猪也因Personal Information Gateway(个人信息门户)缩写后变为PIG而得名;2005年9月,美国政府提出研制第三代搜索;2005年10月,微软也提出了第三代搜索引擎的构想。虽然第三代搜索还在探索之中,但雅虎的人工目录分类和Google的关键词搜索作为前两代搜索的代表和特征已成广泛共识。

    中搜是最早提出第三代搜索概念的公司,也是新一代搜索的坚定实践者。我们认为新一代搜索应该包含以下特征:

    目录分类与关键词搜索的完整结合

    在我们看来,人类获取信息本质上只有两种方式,一种是通过不断的细分目录直到找到需要的内容,一种是提供最相关的关键词直接找到与之相关的内容。但这两种方式都有欠缺,并且互相不可替代。分类方式在内容比较多的情况下,就会出现分类级数过多,搜索变得繁琐;另一方面,有些内容隶属哪个分类并不明确,有时会有歧义,造成对用户的误导。用关键词方式只能搜索目标明确的内容,有些事情尚未发生的情况是不可能通过关键词的方法搜索的。所以一般新闻类的内容大家多半通过门户或新闻网站获取。而新闻的频道和栏目就是一个目录分类体系,它们是由编辑完成的;有时在信息模糊的时候,提取关键词并不容易,这时我们也要借助目录搜索的方式。

    最早做目录搜索的雅虎现在把搜索霸主的位子让给了Google,就是因为它们忽略了另一种搜索方式,给了Google崛起的空间。

    我们也相信Google会发生巨大的变化,因为只提供关键词搜索只是一个残缺的导航方式,它无法对互联网用户进行完整的导航。

    实际上,Google们已经在做了,2002年6月中搜(原慧聪搜索)率先推出了新闻搜索功能,使搜索引擎能够查找互联网上最近发生的事情(一般可以搜到1—5分钟之内的新闻),搜索引擎公司进入其最不擅长的新闻领域,中搜的新闻搜索很快被新浪、网易、Tom、中华网、新华网、人民网、中国网等几十家门户与新闻网站采用。可见用关键词搜索新闻对门户和新闻网站是十分重要的。2002年9月,Google推出新闻搜索,2003年中搜、Google相继推出新闻中心。

    这个里程碑式的产品是用搜索技术提供频道与栏目的搜索。它开始弥补第二代搜索引擎在目录导航方式上的欠缺,之后中搜开始全面完善其内容整合技术,用搜索直接提供财经、体育、娱乐等各种频道服务。

    搜索将无处不在

    中搜在2004年推出的划词搜索产品就是这个思想的应用。用户在Word中、电子邮件中或他看到的任何一个网页中,用鼠标选中需要的关键词,点击搜索按钮就可以完成一次搜索,这毫无疑问是现阶段最便捷的搜索方式。当然搜索还会出现在手机、PDA、MP3播放器等所有数字终端上,搜索终将无处不在,而只在一个输入框中键入关键词进行搜索会变得十分可笑。

    搜索范围将更加广泛

    第二代搜索引擎的搜索范围主要是对互联网内容的搜索,但随着电子信息的不断增加,人们开始希望对自己PC中的内容进行搜索,有时企业用户希望能同时检索企业内部的信息,当然与我们共享的另一台PC的内容也是可以被检索的。自2004年7月,中搜在其桌面搜索产品网络猪2.0中增加硬盘搜索功能之后,2004年10月,Google也推出桌面搜索(Desktop Search Beta)产品提供对硬盘的搜索;2004年12月微软推出桌面搜索;2005年1月雅虎推出桌面搜索;2005年3月,百度推出相似功能的硬盘搜索。至此,主要搜索引擎公司全部进入桌面,开始进一步扩大搜索的范围。

    2005年2月,中搜发布了其网络猪企业版,开始了对企业内部搜索的整合,相信更多的搜索厂商也会开始对企业搜索的整合。

    如果说,第二代搜索引擎搜索的主要对象是内容本身,而新一代搜索引擎甚至要搜索关注同样内容的人,就是说,特定的人群也会成为搜索的对象,这是一种以内容为中心的全新的搜索能力。

    搜索更加智能化和个性化

    几年来各大搜索引擎收录的网页越来越多,相关性排序技术也变得越来越重要。但随着超链分析技术的大众化,大部分搜索引擎公司都拥有类似的技术,我们能看到的就是不同搜索引擎的结果越来越像。第二代搜索引擎的技术似乎正在走向尽头。在超链分析基础上的技术改进已不能实质性的改善搜索的质量。所以我们认为只有将人的知识融入到搜索引擎结果中,才能实质性改善搜索的质量,就是搜索将更加智能化和个性化。

    现在的搜索引擎虽然能够提供很多的结果,但显然还有很大的不足。

    中搜2003年8月推出的智能导航功能就用中文的自动分类和自动聚类技术为不同的用户提供不同的结果、是最早进行智能化尝试的中文搜索引擎。2004年8月,搜狗第一次推出时也尝试了类似的技术,欧洲的Vivísimo等搜索公司也在进行智能化的尝试。2005年6月,新浪率先发布“新浪爱问”知识问答系统,开始了对智能化搜索新的尝试。2005年7月,百度推出了与爱问同类的知识问答系统“百度知道”,再后来雅虎推出了“知识堂”。韩国搜索引擎公司Naver也在提供类似的搜索服务。实际上,Google较早的就提供类似的问答系统“Google Answer”,与国内搜索引擎不同的是Google的答案是由专业人员提供的,而“新浪爱问”、“百度知道”都是由网民自发回答的。另一个不同的是,Google的回答是收费的,而其它系统的回答都是免费的。互动知识回答系统在中国刚刚开始,虽然它现在还不能取代传统的搜索方式,但确是传统搜索的补充,它体现了Web2.0的互动特征。

    还有一批更新的搜索公司试图用智能化的武器打败现在的领导者。新一轮的搜索技术竞争将在智能化和个性化领域展开。

    更即时的互动搜索将成为搜索的主流

    现在人们广泛使用的搜索实际上是一个静态的、被动的服务系统。搜索引擎公司每天使用网络蜘蛛(spider)不停地从互联网上搜索新增的网页,为它们建立快速搜索的索引,然后静静地等待用户的访问。而用户只在需要的时候或想起来的时候输入关键词进行搜索。如果是经常关心的内容,人们还必须每天输入同样关键词进行搜索。第二代搜索引擎只把用户的搜索结果当作搜索服务的全部。而我们认为这只是搜索服务的开始。应该允许人们定制经常关注的内容,中搜IG的定制、RSS阅读器的特定内容定制都是新的搜索方式。如果互联网上出现了新的用户关心的内容,搜索引擎应该能够主动提醒用户。中搜IG的即时滚动与弹出服务就体现了互动搜索的特征。很显然,第三代搜索引擎采用了自动获取、主动呈现的服务方式,当然这种主动服务是以用户的个性化需求为基础的。

    第二代搜索引擎的搜索范围主要是对互联网内容的搜索,但随着电子信息的不断增加,人们开始希望对自己PC中的内容进行搜索,有时企业用户希望能同时检索企业内部的信息,当然与我们共享的另一台PC的内容也是可以被检索的。

    2005年2月,中搜发布了其网络猪企业版,开始了对企业内部搜索的整合,相信更多的搜索厂商也会开始对企业搜索的整合。

    如果说,第二代搜索引擎搜索的主要对象是内容本身,而新一代搜索引擎甚至要搜索关注同样内容的人,就是说,特定的人群也会成为搜索的对象,这是一种以内容为中心的全新的搜索能力。(文|陈沛 本文刊于《网络传播》2006.8)

Archiver|手机版|小黑屋|教你搜 ( 鲁ICP备16006309号

GMT+8, 2024-3-28 17:24 , Processed in 0.201787 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表