中文搜索引擎指南网

标题: 开始逐步减少对搜索引擎的依赖 [打印本页]

作者: sowang    时间: 2017-1-19 00:30
标题: 开始逐步减少对搜索引擎的依赖
原创 2017-01-15 飞翔 齐齐情报社
在Google离开我们之后,“有问题问度娘”成为了我们获取信息的唯一选择。我们太熟悉这种操作方式了,以至于我们忘记了其它获取信息的方式。

作为一名业余的情报收集爱好者,在频繁的搜集信息的过程中,越发感受到了搜索引擎自身的局限性。

搜索引擎包含的信息并不全。

之前看到过一篇文章,大意是说搜索引擎搜包含的信息只占整个互联网信息量的一小部分,更多的信息是在各种网络数据库中。举个例子,国内的企业在工商局都进行了备案,在查看一个企业信用时工商信息是至关重要。使用搜索引擎查找一个企业的注册信息非常困难,最好的方式就是通过国家开放出来的专业网站来进行查询。 对网络数据库检索不利,不是搜索引擎自身的不作为,主要是因为一方面他自身机理决定了不擅长抓取动态页面,另一方面网络数据库为了保护自身的数据,往往采用验证码等方式,分辨出用户还是网络爬虫,屏蔽搜索引擎对自身数据的抓取。

搜索引擎信息的偏好不适合我们

谷歌搜索引擎为了提高用户的搜索体验,发明了PageRank算法。它将大型门户类的网站PR值设的很高,而象一些不常去的政府网站则设的很低,比如发改委的网站。这就导致搜索引擎搜索出的内容,新闻类的、符合大众口味的文章排在前面。可我们作为情报工作者,所关注的信息,往往就是非常小众的信息,这时搜索引擎返回的结果往往都不会令我们满意。

要想找到我们所需要的信息,我们需要逐渐抛弃对搜索引擎的依赖,逐步找出我们所需要信息在互联网上的分布。  比如想要了解一个目标公司的概况,在百度上搜索公司的名字,肯定不好使;去目标公司的网站,往往又会把你搞晕;飞哥的经验是,百度百科是个不错的地方。

这就需要我们能够了解各种网络数据库,并根据他们的特点活学活用。

怎么才能知道那些搜索引擎都不知道的网络数据库呢?

飞哥的经验,观察自身企业自身与外部信息交流的渠道,信息交流的渠道往往就包含网络数据库。比如说企业建立后,为了营销,都会到工商注册,会获得相关产品认证,会申请专利等等。

飞哥最近在做一件大事,正在着手建立网络数据库的黄页,将飞哥积累的一些经验分享给各位。  网站正在备案,前期可能比较丑,还望各位见谅。






欢迎光临 中文搜索引擎指南网 (http://www.sowang.com/bbs/) Powered by Discuz! X3.2