中文搜索引擎指南网

 

首页

首页>>搜索新动态>>正文

人物专访:搜索技术人生

 09:40 新浪科技

2003年03月16日  闫辉 《程序员》杂志


  李彦宏:百度公司总裁

  关键词:硅谷、搜索引擎

  记者:您刚从硅谷回到北京,能向我们的读者简单介绍一下情况吗?记得您写过一本《硅谷商战》的书,最近有没有再写续篇的打算?

  李彦宏:硅谷现在的高科技产业还是非常不景气,大部分公司仍在不断收缩。我的很多朋友也赋闲家中,这在以前是不可想象的。

  不过IT市场中也有亮点,这就是投资界对搜索领域持有浓厚兴趣,并对搜索领域可能出现的各种情况进行预测。像摩根斯坦利这种大型的投资银行对搜索领域中也很了解,哪怕只是一个非常小的公司也都了解。

  谈到《硅谷商战》,我当时是采用章回小说的方式讲述发生在硅谷的一些故事。现在还有朋友让我写续集,讲讲近些年硅谷发生的事件,肯定更具故事性。不过自己做公司太紧张,没有时间写。

  记者:从你了解的情况,现在硅谷对技术型公司的重视程度如何?技术创意还如以前那样层出不穷吗?

  李彦宏:应该说,如果只是泛泛的技术创新,很难引起投资商的兴趣。

  但搜索领域比较特殊。2002年年12月份,华尔街的一位著名股票分析师Mary Meeker写了一份报告。其中,他认为Internet作为一种现象,本质可以用三个单词来表示:Search、Find、Obtain,也就是搜索、发现、获得。他像ebay、yahoo这样成功的公司全都是充分利用了这三种本质。据说,ebay现在正在测试新的用户界面,特点就是首页的主要部分只有一个大的搜索框。

  记者:从事搜索引擎技术研究的公司层出不穷,搜索引擎的发展也经历了很多阶段。您认为搜索引擎发展有哪些里程碑?

  李彦宏:我认为有三个里程碑:在1993年左右,大家感觉网上的信息很多,需要搜索,但当时对搜索技术的了解很少,于是就把研究领域中的信息检索技术照搬过来做了搜索引擎。因此第一代搜索引擎就是按照学术界资料检索技术,而没有考虑到互联网的网状特性和超文本。

  我在1996年开始意识这样一点,互联网和以前信息检索最大的差别在于互联网上的信息是有指向的。检索的时候,把这个属性考虑进去,才能给大家提供更相关的结果,这就是“超链分析”。采用这种技术后,搜索引擎的发展出现了巨大飞跃。像google宣称的pagerank就是基于这种想法的,到2000年,主流搜索引擎都已经采用了这种技术。

  第三就是竞价排名,虽然有人认为这样做太商业化,但实际上这时搜索引擎的发展已经超越了技术层面,属于思路变化的范畴了。检索结果前的sponsor链接都是和检索结果有一定关联的,而且这些内容本身对用户也有商业价值,同时让企业能够更直观的参与检索结果。

  实际上,搜索引擎不是单独某项技术,本质上它是一种软件服务。一个好的搜索引擎是需要经过多年积累才能完善的,完善的服务才能被称为拥有完善的技术。既然是服务,就要求在细节上精雕细刻。具体讲,“超链分析”、竞价排名的技术难度并不足以产生壁垒。

  在技术上,很多优秀的程序员喜欢攻克一个难关来证明自己,而忽略实现过程中有可能引起系统崩溃的细节。很多人认为模仿一个优秀的产品,只要做出对方具有的功能就可以。事实上,作为服务,必须让用户感觉可依赖,这才是在工业界做出一个受欢迎产品的要求。

  记者:软件服务也是软件产品发展的趋势。您是如何意识到在商业运作中,软件技术应该以用户需求为导向的呢?在思想上有没有经历过一些转变?

  李彦宏:的确是我的一些经历让我产生了这种转变。我在1997年夏天加入Infoseek之后,当时全世界范围内,也只有硅谷几家真正的互联网公司。在这里,我能够切身体会到技术作为一项服务给人们带来的影响。

  普通用户就是用一个简单的搜索框检索内容的,他并不关心背后的技术。当时,我们每天除了编程外,还会经常察看后台流量的变化,一旦服务出现不稳定情况,天花板上的警戒灯就会闪烁,这时所有的程序员就会很紧张,知道自己的软件在提供服务时产生了问题。不断加强软件服务意识,这是我在Infoseek得到的很大收获。

  去年下半年我有四五个月参与了很多,我们做了一个闪电计划。当时项目时间也很紧张,但我指出这次计划成功与否的衡量指标不是技术指标,而是用户访问的pageview。开始,大家都觉得自己只是一个程序员,怎么能够左右pageview呢!我坚持这样的理念:只要做的技术足够好,方便用户,那就会有人喜欢。年底的时候,事实也证明了这一点。

  对搜索引擎,我能够站在用户的角度使用,同时我也站在程序员的角度知道其内部是如何实现的,所以我能迅速指出缺乏的关键之处,而没有这种工作经历的技术人员可能不太重视。

  记者:第一代搜索引擎现在存活下来的很少了,主要原因是什么?大家在使用搜索引擎时都倾向于使用更多种类的搜索引擎,如何体现出其中的差别化?

  李彦宏:很多搜索引擎公司倒掉,这说明搜索引擎技术发展的很快,只要下一代的技术做的好就会很快取代前一代。不过,搜索技术成就了很多公司的辉煌,参与的人员也都得到了相应的回报。

  从用户体验看,使用方法非常类似,不大可能构筑使用障碍,转换搜索引擎的几乎是不需要代价的。因此,好的技术很容易吸引用户转向自己。同时搜索引擎是免费的,不可能像其他产品通过降价或者某种商业运作方式来争夺市场。

  记者:那搜索引擎的行业壁垒主要表现在哪里呢?

  李彦宏:实际上,简单的搜索并不难实现,一条grep语句就可以实现某些简单的搜索,但创建一个成熟、受欢迎的商业化搜索引擎,其难度是很高的。

  评价搜索引擎的优劣有四个指标:收集的有效网页数量,这本身就需要很高的技术。因为尽管小的数据库中也可以找到需要的资料,但用户总有一种用更大的数据库的倾向;
第二是更新率:要快速更新信息,就需要提高程序设计的效率。Spider的效率直接影响数据库内容的更新速度。

  第三是搜索速度:同样需要软件设计上重视效率;第四就是相关性:把更满足用户需求的结果放在前面,这是需要综合很多因素进行计算的。

  记者:搜索引擎技术在全球的竞争如何?

  李彦宏:搜索引擎技术是相通的,因此不同语言的版本推广上相对容易一些。因此我们一直在说,如果百度能够和google在中国对抗的话,那在任何一个国家都可以的。

  我们还准备推出日文和韩文版,其实全球日文信息量可能比中文还要大。但在日本就没有一家搜索引擎公司。前一段时间,我们接待了日本的一位政府调研人士,调研的题目是为什么在中国韩国有很多小的高科技公司,但日本很少,后来发现日本在IT领域中严重依赖于美国技术,而且很多地方都倾向于大型公司,而不喜欢去创业。

  关键词:程序员

  记者:现在百度技术团队构成怎样?

  李彦宏:百度是一个技术型公司,开发团队包括四十多名软件工程师,主要做Spider和Search的开发,还有测试、技术支持以及大客户支持工程师。现在团队已经形成了比较好的管理梯队。软件服务涉及到很多细节,所以我们不是靠某一个程序员的天才,而是靠一批对行业了解、足够聪明、并合作的程序员。

  公司创始时,我的确有担心国内的技术实力同国外差距很大,所以还特意在硅谷设立了办公室来招人,准备两边协同工作。后来发现国内的技术人员非常优秀,完全可以做出来世界级的产品。

  记者:开发团队从几个人发展到现在数十人,是否在开发管理上经历过曲折?

  李彦宏:的确如此,在推出最早的版本之后,我的精力就放在宣称推广等商务活动上了,技术上依赖带起来的技术团队。后来,技术团队膨胀的太快,在技术管理上出现了一些危机,主要表现在公司逐渐壮大的过程中,很多人对自己的位置定位不是很准。一些好的技术人员对技术关注越来越少,而对管理产生了兴趣,并对未来的发展产生了迷茫。于是借助去年实施的“闪电计划”,我又重新回到开发中,带领一个新技术团队。

  硅谷的一些经历能让我告诉程序员应该重视的是什么,对于角色转换应该有什么样的期望值。我告诉他们,我看到的成功硅谷创业型公司有什么共同之处。我认为,作为一个好程序员或者令人放心程序员的标准不仅要能够解决问题,而且做出来的产品是可信赖的。

  闪电计划完成后,除了完成当初设定的技术指标和商业指标外,更大的成就就是又带起了一个好的技术团队,他们之间的合作现在已经非常默契。

  记者:您在招聘时,感觉国内的程序员和硅谷有什么差别?

  李彦宏:我们一般沿袭硅谷招聘的做法,考察程序员时,除了个人技术能力之外,最看中的是他对公司文化是否认可。如果这个人只考虑找一份工作而已,那他就很难和其他人合作,没有团队合作的精神,就很难认同公司的文化,融入公司的环境。

  但同硅谷有差距的是,国内的程序员在工业界、商业化环境下工作经历不够。因为中国真正做技术的公司太少了,大部分都是系统集成公司,在这些公司中,对软件的基础知识已经很少用到。所以我们招收比较多的是刚毕业的学生,这些人虽然没有工作经验,但基础知识还掌握的比较牢固。因为我们更看中有培养空间的人,看中他们的潜力。而在硅谷,只有大公司才招毕业生,一方面是为了充实新生力量,同时也是为了公司形象考虑。即便在公司很困难的时候,一边裁员,一边还要招人。

  在美国,很多公司认为只有具备了高技术门槛,才能保证公司迅速成长,因此他们是真正在做研发,程序员也真正地在做产品。而国内很多公司就是技术支持或者系统集成商,程序员做的技术很少用到学校的知识,也不需要考虑效率和算法,所以也很难得到锻炼。而在美国工业界,学校学到的知识能够真正应用起来,同时还要了解实现时需要什么样的技巧。

  关键词:搜索人生

  记者:谈谈你个人发展的经历?

  李彦宏:我是1991年到美国准备读博士的,因为只有读博士才有奖学金。但到二年级下半年的时候,我越来越认同工业界的做法,因为我去松下做过一段时间的实习,让我了解到工业界更关注是否适合用户的使用,是否能够得到大规模的推广。而我的理想也是为了影响更多的人,让更多的人从中受益,所以得到硕士学位后就离开了。

  首先我进入了华尔街日报集团,当时道琼斯准备做网络版媒体,其中包括金融方面的集成信息检索系统,当时采用C和在Sun的服务器和unix环境下做了三年半的开发,当时的工作环境很自由,我也很喜欢。

  但随着互联网的迅猛发展,华尔街作为一个媒体更重视编辑记者,并没有把技术的价值提升到一定的高度。尤其是我认为“超链分析”可能会改变整个产业的发展后,发现公司无法提供这方面的发展机会。

  1997年,我加入Infoseek,当时这个公司在硅谷的口碑很好,而且很多同事对搜索引擎的开发经验和独特见解令人羡慕,在那个时候,尽管硅谷有成千上万的小公司,但像Infoseek这样真正的互联网公司还很少。

  不过后来Infoseek被迪斯尼收购并开始创建GO网站,但迪斯尼作为一家成功的传统企业并不了解互联网,不了解硅谷,不了解网络重新创建一个品牌很难。很可惜,从那时起,Infoseek开始忽略技术,而一味去强调和传统媒体的结合,策略已经发生了转变,开始走下坡路了。

  在互联网上,很多事情不是钱能够砸出来的,时机已经过去。总之,Infoseek作为一个互联网公司是失败的,没有能够和yahoo继续竞争下去。

  记者:我看到你是“超链分析”专利的发明人,当时是怎样的一种情况呢?

  李彦宏:在美国,有专业的专利律师。但当时这个专利是我的职务发明,所以发明人是我,拥有者属于我任职的公司,而公司又不懂这个东西的重要性,也不愿意去冒风险打官司。

  记者:在软件技术专利保护上,美国能保护到什么样的层次呢?

  李彦宏:算法是可以受保护的,最著名的就是LZW的算法,先做几乎用到的程序都要向专利所有人付费,还有adobe公司的pdf, jpeg文件格式等都要向unysis公司的专利付费。当然,拥有这种专利的公司规模一般也很大,不会只依赖于专利费生存。但总体上看,在国外的软件专利保护机制下,大家比较习惯去付费的。
 

 

相关:

Copyright ©  2001-2002 SOWANG.COM All rights reserved. 
中文搜索引擎指南网 
版权所有