请选择 进入手机版 | 继续访问电脑版

搜索爱好者

 找回密码
 注册会员

QQ登录

只需一步,快速开始

查看: 5838|回复: 4

信息周刊:搜索工具大搜捕

[复制链接]
发表于 2008-12-22 22:56:08 | 显示全部楼层 |阅读模式
http://www.sina.com.cn  2008年12月22日 19:31  《信息周刊》杂志
  如今的主流搜索引擎采用的方式大同小异,缺乏定制化。初创公司的一系列行动意味着这种现状可能会发生改变

  文|Richard Martin 译|蔡晶

  很长时间以来,由于网络搜索市场存在着过于强大的垄断厂商,因此拥有创新技术的初创企业在这里难以找到成长的空间。但如今业内风险资本投资、产品开发、企业收购等活动络绎不绝,这一切标志着搜索界即将进入新的纪元,而术业有专攻的搜索厂商们也将大展拳脚。

  根据研究机构尼尔森在线公司(Nielsen Online)的数据,领头的谷歌公司(Google,下称谷歌)囊括了62%的网络搜索查询量,而雅虎公司(Yahoo,下称雅虎)和微软公司(Microsoft,下称微软)则屈居其后。排在这三巨头之后的,是众多的业界新贵,它们推出了各种面向消费者的网络搜索,包括新型语义(semantic Web)和语境(contextual)网络搜索服务、移动搜索以及通过其他形式呈现搜索结果(比如在NewsGator RSS阅读器里显示结果)的服务。

  过去12个月中发生的一连串事件,使得被少数几家巨头统治的搜索市场,看上去像是进入了群雄割据的争霸时期:

  ◆ 去年年底,由一群欧洲科学家于2004年成立的语义网搜索引擎哈基亚公司(Hakia)推出了“社交搜索”功能,旨在为用户找到趣味相投的人牵线搭桥。今年1月,该公司得到了500万美元的追加投资,总投资额累计达2,100万美元。

  ◆ 今年1月,语境搜索专家Silobreaker公司推出了具备关系匹配(relations-mapping)功能的新型引擎,它可以对主题和大众行为进行趋势分析。

  ◆ 不久之后,初创企业冲浪峡公司(Surf Canyon)发布了名为探索引擎(Discovery Engine)的浏览器插件,它能够实时消除主流引擎搜索结果中存在的歧义。换句话说,它可以根据相关性将搜索结果重新排序。

  ◆ 3月,搜我公司(SearchMe)推出了“可视化搜索”功能,对非文字型搜索提供了分类建议。这个已经成立3年的公司今年又得到了1,600万美元的风险投资,加上先前红杉资本公司(Sequoia Capital)和雷曼兄弟公司(Lehman Brothers)的投资,总投资额累计已达3,100万美元。

  ◆ 5月,别出心裁的“白话英语”搜索引擎Ask.com宣布将收购旗下拥有Dictionary.com和Thesaurus.com两家网站的Lexico公司。

  ◆ 6月,搜索结果整合商Viewzi公司推出了新工具,能将主流搜索引擎的搜索结果用新颖、友好的界面呈现出来。

  ◆ 7月,初创企业Cuil公司正式启动,这家由两位前谷歌员工创立的公司声称要搜索到比谷歌还多的海量网页。

  对企业用户来说,普通的谷歌搜索会带来冗余的信息,而新搜索技术的繁荣可能会解决这一日益加剧的问题。冲浪峡公司的创始人马克·克莱默(Mark Cramer)说,对于那些本身工作离不开搜索的网络用户们而言,“他们不仅仅是在网络上进行随意的探索和体验,他们有着具体的目标,而且需要在短时间内找到这一目标。”

  搜索界三巨头当然不会坐以待毙。今年7月,雅虎发布了名为Yahoo Search Boss的网络服务平台,程序开发商可用雅虎的应用编程接口(API)作为基础,创建出能与雅虎搜索引擎相媲美的新型搜索工具。与此同时,微软也宣布了收购语义搜索专业厂商Powerset公司,目的是增强Live Search的性能。

  谷歌则继续推进自己的宏伟计划。谷歌的搜索大师们在相关采访中曾表示过,公司正将165亿美元年收入中的相当大一部分,投入到搜索工具的改进及推广上。然而,谷歌的战线铺得实在是太长了:它不仅在推广移动设备操作系统Android,还推出了Chrome浏览器与Internet Explorer竞争,并且又在进军云计算(cloud computing)领域。除此之外,谷歌也在加大投入进行企业级搜索研发,并尝试围绕清洁的可再生能源开拓出一个全新的行业。

  谷歌的研发项目排得满满当当,虽说该公司市值达到1,460亿美元,但这么多项目也让它疲于奔命了。和以前许多IT巨头一样,谷歌可能无法专注于核心业务,从而错过下一波的创新大潮。
 楼主| 发表于 2008-12-22 22:56:15 | 显示全部楼层
  搜索引擎不再千篇一律

  所有这些研发活动说明了什么问题呢?正如专题网站“搜索引擎地带”(Search Engine Land)的总编丹尼.沙利文(Danny Sullivan)所说的,我们正在进入“搜索3.0时代”。沙利文将“搜索1.0时代”定义为上世纪90年代后期,当时AltaVista、Excite、HotBot、Infoseek、Lycos和WebCrawler等群雄并起。不过,这些引擎都是利用简单的文本搜索标准来查找和排名网页。比如说,如果你搜索“Nerf ball”,你将会得到许多同时包含“Nerf”和“ball”这两个单词,并且单词靠得非常近的网页。然而,市场营销人员破译了这些网页爬虫(Web crawler)的运作机理,开发出了相应的欺诈策略并迅速传播开来。结果,这种粗放型的搜索方式不再有效了。

  “搜索2.0时代”(即谷歌时代)由此诞生了。谷歌的“网页排名”(PageRank)系统摒弃了简单的文本搜索方法,使用了先进算法对网页进行排名,通过分析网页上人工生成的链接结构来决定网页的相关重要性,链接到某一特定网页的链接数量和质量是排名的主要依据。该方法是目前网络搜索的主流形式,对相当多的人来说,这种方法收效不错。

  不过,随着越来越多的人意识到谷歌网页排名系统的局限性,“搜索3.0时代”开始萌芽:搜索引擎将垂直的搜索结果与谷歌或微软的LiveSearch等主流引擎所提供的横向跨网页搜索结果有机地整合到一起。

  面对新时代的来临,谷歌自然也有自己的计划,但最让人感兴趣的还是那些初创企业所开发的新工具,这些工具能做主流引擎所不能做的事。

  今年1月,在加州棕榈沙漠(Palm Desert)举行的演示会上,搜索与关联分析(relational-analysis)供应商Silobreaker公司的CEO克里斯托弗·曼森(Kristofer Mansson)就宣称,Silobreaker引擎“能分析网页内容的语义和语境”。

  Silobreaker对追踪新闻人物和当前热点事件特别有效。它提供的搜索结果中包含了一些很有用的东西,比如说语境提取(某人或某主题是如何与其他人、机构或分类发生关联的)、绘图、趋势跟踪(世界各媒体中提到的总次数以图形方式显示出来)以及关系匹配等。该搜索引擎以10,000家新闻、博客、研究和多媒体网站作为数据来源,将有关全球性问题、科学、技术和商业等方面的内容进行整合。

  目前,Silobreaker正以免费网络工具的形式进行推广。曼森已经看到了该引擎在大型企业和政府机构(包括情报机构)中的应用机会。该公司的业务开发总监马茨·比约勒(Mats Bjore)曾帮助瑞典军方设立开源的情报研究项目。

  Silobreaker最酷的功能莫过于关系匹配了。该功能可以将与搜索主题词紧密关联的人或主题用图形的形式显示出来。通过操纵图中的节点,你可以看到两个兴趣点是如何相互关联的。你只需点击两个节点连线的中点,就可阅读解释两者关联性的文章或内容。

  企业可以利用Silobreaker来追踪市场趋势,将新闻事件与其产品或所在行业进行关联匹配,还可追踪竞争对手公司高管间的联系、他们以前所在的公司以及业界发展动态。曼森预计,Silobreaker公司未来将与内容出版商或各行业的领先企业合作,开发具有高度针对性的工具,其主题可以是燃料电池、衍生品交易票据或纳米技术等,搜索结果既包含收费内容,也有普通的网页。

  和谷歌的通用搜索(Universal Search)在同一个月推出的Mahalo是个复古型的搜索引擎,它通过人工编辑的方式将自动化的搜索结果进行筛选。Mahalo公司是由前IT博客作者贾森·卡尼斯(Jason Calacanis)所创建的,它借鉴了维基百科的社区生成内容方式,以改善搜索结果的品质。如果用该引擎搜索“帕布罗·毕加索”(Pablo Picasso),你得到的搜索结果将是一段毕加索的生平简介,外加排名头7位的网页,以及通往毕加索在线作品和相关视频的链接。不过,即便Mahalo公司的目标只是弥补谷歌的不足而非取而代之,利用编辑人员来筛选庞大的网络信息也是项非常艰巨任务。
 楼主| 发表于 2008-12-22 22:56:26 | 显示全部楼层
  以媒体为中心的搜索

  一些新型的搜索引擎公司正致力于研究如何通过不同形式来呈现搜索结果。今年6月推出的可视化搜索引擎Viewzi可以根据客户想要搜索的内容类型,将结果以不同的视图选项呈现。比如说,如果你在找一段视频,你就会看到来自YouTube、Veoh等网站的视频片段。在Viewzi的搜索结果中,网页是以缩略图而非文字链接的形式显示。Viewzi还采用浮云一般的三维界面来显示网站与其他相关网页之间的关联。Viewzi公司的乔万尼·加卢奇(Giovanni Gallucci)表示:“我们在规模上超越不了谷歌,所以我们将重点放在了如何重塑搜索结果,而不是重新发明搜索引擎上。”

  这一方式意味着利用主流引擎得到搜索结果,但是以更富有创意的模式呈现结果。对商业客户而言,最具吸引力的是Viewzi掌握用户喜好的能力:系统能回顾用户的搜索历史,查看用户选择了什么结果、选择如何显示结果以及用户如何与结果进行互动。因此,假如你经常搜寻企鹅在自然栖息地的照片,Viewzi的搜索结果将提供与水禽相关的内容,而不是显示与匹兹堡企鹅曲棍球队相关的内容。“我们的引擎能够记忆和领悟用户的个人偏好,所以它可以说是为你的特定需求度身打造的。”加卢奇表示。

  已经创立4年的Rollyo公司提供了更为个性化的搜索引擎,它可以让人们将多达25个网站捆绑起来,揉合出适合自己需求的搜索引擎。用户可以创建自定义的搜索工具,并通过Rollyo提供的接口与他人分享。谷歌的自定义搜索引擎也提供了类似功能,但尚未被广泛应用。

  除了以上这些技术外,还有针对特定用户群体的搜索引擎,比如Quintura Kids搜索引擎就使用了“云搜索”(cloud search)功能,为孩子们提供各种层次的标签,让他们不用输入词组查询,就能迅速跳到相关的子类别,比如说《小查和寇弟的顶级生活》(The Suite Life Of Zack & Cody)或者《孟汉娜》(Hannah Montan)等热门儿童剧。

  最后,我们还可看到一些根本算不上搜索引擎的新工具。这些工具通常会被内嵌到其他类型的应用程序中。2月份推出的冲浪峡工具就是个浏览器扩展程序,它的“实时隐含语义个性化”(semantic real-time implicit personalization)功能可以将主流搜索引擎的搜索结果进行再排序,将最具相关性的结果排到最前面。冲浪峡工具密切注视并学习用户的行为信号(behavior signal),计算出“瞬时相关性”(instantaneous relevancies),以便从海量的搜索结果中过滤出最有用的少数结果。

  初创公司Jodange在今年9月推出的工具Top of Mind也是其中之一。该工具能够追踪那些舆论领袖的认知价值。Jodange公司的技术可以识别在特定议题上拥有影响力的人物,监测他们的观点如何随时间的推移而转变,以及他们如何推动媒体及公众的情绪变化。该公司创始人兼CEO拉里·利维(Larry Levy)在www.jodange.com网站上提供了免费版本供人下载使用,但对于那些想跟踪“某位知名人士对己方市场和竞争对手做出过何种评价”的企业,他也计划推出相应的订阅服务。

  “长期以来,我们一直被迫使用关键词搜索这种不太有效的手段。”利维说,“如今语义网搜索等新工具可以追踪锁定人们最感兴趣的话题,并将相关信息提供给人们。这种能力是建立在我们充分了解用户的知识范围、观点和兴趣的基础之上的。”

  企业用户总是不懈追求生产率优势,多年来它们一直期盼获得理想的搜索工具。冲浪峡公司CEO马克·克莱默在谈到公司的工具时说:“和其他许多创新一样,这个概念是从无数次的挫折和失望中诞生的。”

  当各种利基产品挤入主流工具的地盘并占据一席之地时,那人们要抱怨的恐怕就不是主流搜索引擎的种种缺憾了。根据不同的搜索需求,他们不得不在不同的工具之间不断切换,这或许又会成为人们满腹牢骚的根源。不过话又说回来,如果新的搜索技术能够更好地帮助我们找到所需信息,那这种副作用我们应该能够接受。
 楼主| 发表于 2008-12-22 22:56:38 | 显示全部楼层
  谷歌也有局限

  文|Richard Martin 译|蔡晶

  自从2007年5月推出通用搜索功能以来,谷歌一直在推广这个新一代的网络搜索引擎。除了常规的网页链接之外,通用搜索的结果中能显示视频、图片、新闻、地图和书籍等各种内容。

  谷歌搜索产品和用户体验副总裁玛丽莎·梅尔(Marissa Mayer)在那时曾说过,通用搜索将谷歌“各种分散的专题搜索引擎整合了起来”。然而,大多数用户仍然固守过去的搜索方式。今年9月10日,梅尔在博客发表了1篇名为《搜索的未来》的文章,她在文中表示:“我们的通用搜索几乎没能影响人们的搜索方式。”她透露,谷歌将在几个月内推出一个新的用户界面,给用户们带来有关新型媒体的全新搜索体验。

  通用搜索项目仅在启动阶段就耗费了100位谷歌工程师两年多的时间。该技术使得谷歌能横向查询多个索引,而不会使计算负荷以几何级数递增。

  梅尔在文中还提到了未来几年内搜索引擎改进的四大领域。第一个领域是媒体,包括同时搜索各种类型媒体的通用搜索;第二个领域是模式,比如说简化移动设备的搜索方式,用声音输入而非键盘输入,或者是输入图片而非文字等。第三个领域是个性化,包括针对位置和社会关系进行定制。最后一个领域是语言,这意味着对搜索结果进行翻译。

  谷歌并不是唯一试图在搜索结果中添加新功能的公司。谷歌的研究主管彼得·诺维格(Peter Norvig)表示,他们拥有无与伦比的资源,但并不能保证这一定带来与企业用户最息息相关的突破性进展。

  以通用搜索为例,谷歌服务可能最终面向的是大众市场。它的业务目标是满足占市场很高比例的普通搜索查询需求,而不是创建高度专业化的数据密集型(如视频、图像等内容)搜索工具。诺维格以军事分析为例进行了解释。纯粹的军事研究机构客户也许会寻求核导弹发射基地的照片,因此这类机构愿意花很多时间手工微调专业搜索应用程序。他说,虽说谷歌拥有一万名工程师,但它也不可能在单个应用程序搜索工具上花这么多的时间,因此它得采用“范例学习”(learn by example)的做法。比方说,某篇文章中有些图片,而图注里有些单词,而谷歌要做的,就是开发出能将单词与图片关联起来,并由此进行学习归纳的搜索技术。

  “或许有的搜索厂商会专注于某一特定领域,并成为该领域的专家。”彼得表示,“这是很正常的事情。”
发表于 2008-12-24 09:22:16 | 显示全部楼层
各个垂直搜索各有其价值。但要让较多的普通用户接受并使用,还有一定的困难。我不太看好垂直搜索。
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

Archiver|手机版|大川乒乓网|中文搜索引擎指南网(搜网) ( 鲁ICP备16006309号

GMT+8, 2019-10-16 18:44 , Processed in 0.134469 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表