只需一步,快速开始
第一步:抓取网页 第二步:建立索引数据库 第三步:在数据库中按特定排序储存网页
工作步骤一:抓取与索引编制 (CRAWLING AND INDEXING) 搜索爬虫:Googlebot 网站所有者有权决定自身内容是否被搜索引擎索引 以索引形式整理信息 工作步骤二:算法(ALGORITHMS):你需要的是答案,而非网页 200多个因素决定搜索结果和结果排序 PageRank 工作步骤三:反垃圾内容(FIGHTING SPAM) 计算机检查与人工检查相配合
附:关于Google的搜索结果排名运算法则PageRank 网站质量等级标准:它依靠一系列标准计算,当我们在Google搜索关键词的时候,页面等级高的网页排序会越靠前。 最初想法源于论文档案的管理:论文被引用次数与质量成正比。 PageRank主要指标:a. 指向你的网站的超链接数量(你的网站被别人引用),数值越大,表示你的网站越重要;b. 超链接你的网站的重要程度,意思就是一个质量好的网站有你的网站的超链接,说明你的网站也很优秀;c. 网页特定性因素:包括网页的内容、标题及URL等,也就是网页的关键词及位置。
使用道具 举报
Archiver|手机版|小黑屋|教你搜 ( 鲁ICP备16006309号 )
GMT+8, 2024-3-29 16:07 , Processed in 5.763369 second(s), 20 queries .
Powered by Discuz! X3.2
© 2001-2013 Comsenz Inc.