请选择 进入手机版 | 继续访问电脑版

搜索爱好者

 找回密码
 注册会员

QQ登录

只需一步,快速开始

查看: 5212|回复: 0

i 学堂:搜索引擎与网络学习

[复制链接]
发表于 2015-3-24 13:07:41 | 显示全部楼层 |阅读模式
2015-03-24 李显辉 厦大图书馆




1[size=1em]搜索引擎分类
回顾发展历史,搜索引擎大致有三个分类:


1. 分类目录(directory)搜索引擎:代表工具——Yahoo Directory,由人工完成对网络信息的分类与索引,只要找到相关目录,就完全可以找到相关的网站。

优势:由于人工控制,搜索结果保证准确性,适用于找“面”(某领域)的信息。

缺点:费时费力,不适应大范围信息检索;搜索体验被动,侧重于导引与浏览。

例:利用雅虎目录(http://dir.yahoo.com)查找百科全书站点












2. 全文检索搜索引擎:代表工具——Google与百度,通过计算机程序(Spider)自动到各个网站收集、存储信息,并建立索引数据库供用户查询。


全文检索搜索引擎工作步骤包括:

第一步:抓取网页

第二步:建立索引数据库

第三步:在数据库中按特定排序储存网页






3. 元搜索引擎:又称集合式搜索引擎,本身一般没有索引数据库,只是搭建平台综合搜索工具,搜索结果集众家之长。


代表工具:Dogpile、Clusty和Vivisimo。




2[size=1em]搜索引擎工作原理与异同
以下以Google为例,说明现阶段主流的全文检索搜索引擎的幕后原理:

演示网址入口:Google主页-Web Search-How Search Works

工作步骤一:抓取与索引编制 (CRAWLING AND INDEXING)

搜索爬虫:Googlebot

网站所有者有权决定自身内容是否被搜索引擎索引

以索引形式整理信息

工作步骤二:算法(ALGORITHMS):你需要的是答案,而非网页

200多个因素决定搜索结果和结果排序

PageRank

工作步骤三:反垃圾内容(FIGHTING SPAM)

计算机检查与人工检查相配合
各个搜索引擎在细节上存在差异:

如采集范围和数量异同、索引方法不同、反馈结果的数量不同、排序方式不同、交互体验不同、结果输出格式不同……

但它们的共同追求目标是——快速地帮助用户找到最有价值的信息!
附:关于Google的搜索结果排名运算法则PageRank

网站质量等级标准:它依靠一系列标准计算,当我们在Google搜索关键词的时候,页面等级高的网页排序会越靠前。

最初想法源于论文档案的管理:论文被引用次数与质量成正比。

PageRank主要指标:a. 指向你的网站的超链接数量(你的网站被别人引用),数值越大,表示你的网站越重要;b. 超链接你的网站的重要程度,意思就是一个质量好的网站有你的网站的超链接,说明你的网站也很优秀;c. 网页特定性因素:包括网页的内容、标题及URL等,也就是网页的关键词及位置。

3
[size=1em]搜索原则与技巧进阶
搜索原则一:关于检索词

1. 选择有代表性的专有名词:检索词的专业性(简练,避免宽泛);检索词的代表性(包含于所需页面,最能代表信息搜索需求)。

2. 双词检索原则:细化搜索条件(搜索条件越具体,搜索结果越明确)。






搜索原则二:持续搜索,不单纯为了搜索而搜索,可以利用它来探索学习。

搜索原则三:多关注搜索结果的后续页面,不要只筛选第一页;从之前搜索到的页面提取新关键词,用于二次搜索。

搜索原则四:带有批判精神,不盲目相信搜索结果,有自我评价判断意识。

一个思路:多个信息源的相互参照与求证。

搜索基本技巧:了解搜索引擎功能


1. 分类搜索:新闻、图片、网页到图书、专利、学术信息



2. 搜索结果展示:是否有广告内容的特殊标识?

3. 搜索工具选项:精炼搜索结果




4. 高级搜索(Advanced Search)

搜索技巧进阶一

巧用布尔逻辑符,限定搜索范围

AND(默认空格)、OR、NOT(一般用英文字符的“-”号)

搜索技巧进阶二

利用英文字符的双引号,进行词组检索






搜索技巧进阶三

Google和百度的“高级搜索”藏身于主页的设置栏,好好利用它,可以提高搜索精度。






搜索技巧进阶四

利用快照(Cache)功能,提高筛选搜索结果的效率。

三个好处:避免无效链接和快速打开页面、关键词高亮显示。






还需要什么?

还需要一点想象力,搜索时,想象目标页可能包含哪些词汇、提问时想象可能的答案。加入“如何”、“批评”来寻找指南或不同见解。


4
[size=1em]Google实用搜索语法

1. 关于Google

Google是当今世界范围内最受欢迎的搜索引擎,凭借其精确的查准率,极快的响应速度广受用户好评,同时又因为其坚持不走商业化道路,保持开放的企业文化而深受人们的拥戴。


实际上,Google所代表的已不仅仅是某项先进的技术,而是一种新兴的文化。






2. Google的典型搜索语法

filetype:限定搜索结果的文档类型

格式:“检索词 filetype:文档后缀名”

例:搜索主题为社会心理学的ppt演示文档






site:限定于某个网站或某一类网站搜索

格式:“检索词 site:xxx.com(即某个域名/网站)”

例:在中国教育网站范围内搜索大学生心理辅导类资料






intitle:限定在网页标题内搜索关键词

例:搜索题名中包含“台北故宫博物院”的文物图片






更多实用语法,参见网络资料《Google搜索从入门到精通》。


轻松一刻:利用Google与百度的以图找图功能来“按图索骥”

这位美女是谁?做过什么?







个人信息一目了然:

您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

Archiver|手机版|大川乒乓网|中文搜索引擎指南网(搜网) ( 鲁ICP备16006309号

GMT+8, 2017-10-21 03:39 , Processed in 0.107950 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表