上次文章大概谈了一下我对搜索的初步理解,随着对搜索的兴趣的增加和接触的增多,渐渐的看了9238前辈的很多文章,特别是他的《关键词 等同词 同义词
上位词
下位词》的文章,呵呵,多年前的文章现在还是指导着我啊。接着又看到了《抛砖引玉之六:搜索基础site篇》,呵呵,认真的精神鞭策着我,这次我说说自己关于site
命令 和 inurl 命令的一点看法。以下的实例都是发生在百度。
Site命令在百度中的用法,意义的简单介绍以及inurl命令在百度中的用法,意义的简单介绍,请参考
http://www.baidu.com/search/page_feature.html#09
1、在百度里输入:site:e23.cn和site:www.e23.cn(百度对中文标点的支持和英文标点的支持是一样的),
前者找到相关网页约47,700篇,后者找到相关网页约1,740篇,收录的数量为什么会不一样呢?根据对site命令的意义和两个命令不同结果的仔细观察,我们不难发现前者命令中有
sms.e23.cn/sms/, bbs.e23.cn 中的内容;而后者的结果中只有 www. e23.cn
的内容;因此当你输入site:www.e23.cn时候,百度只会把url为www.e23.cn
上的相关信息呈现给你;而当你输入site:e23.cn的时候,百度不仅会把url为www.e23.cn 上的信息还有bbs.e23.cn的信息等其他一切url上含有e23.cn的信息呈现给你,这就是两者的区别。当用site
命令时,在前几步中,最好是用site:e23.cn而不是site:www.e23.cn因为前者的获得的范围比后者广,避免在一开始的时候遗漏掉想要的信息,除非你有什么特殊的要求。当site命令前是空白的话就会默认查询
site后网站所有的信息在搜索引擎中收录的情况,google,百度,一搜,中搜,新浪都支持site前是空白的搜索;sohu不支持;
2、这两个命令在特定的范围内再次缩小搜索范围都非常有用,使搜索的结果更准确,搜索的过程更快速。
例如我想找在百度中找些中文的俄罗斯网站,当输入命令inurl:ru 分析结果中两个项 www.glasscontec.ru/client/ru/、
www.white-collar.net/01-author/r/02-ru_zj 发现无论“ru”出现在url中的什么位置,都被计算进进去了,甚至根本不是我想要的结果:svn.clkao.org/svnweb/freebsd/log/cvs/trun
这个结果最让人啼笑皆非,就是因为结果中的“trun”有“ru”呵呵,电脑是不是太蠢了。当使用site:ru命令时,再分析结果中的两项 http://pikkunipsu.newmail.ru/
、electronics.car-electronics.weststore.com.ru 都是域名为ru
的结果,从某种意义上说这才是我们真正想要的结果。
3、inurl: 、 inurl:“ru”和inurl:(ru) 等同于inurl:ru;而inurl:.ru ;
inurl:_ru;inurl:-ru都是错误的命令,百度不支持。site:/ru命令与site:ru命令等同,加不加“/”无所谓。这两个命令可以连用,例如我想到sina门户搜索新闻,输入site:sina.com.cn
inurl:news 但发现有很多留言版中无用的信息,于是就用命令site:sina.com.cn inurl:news -inurl:cgi
就能很好的达到目的。两个命令是通过布尔语法连接起来的,由此可见,最基础看似最简单的布尔语法其实很重要很有用。
小结:第一步选好代表自己想要信息的关键词,范围可以大点,避免遗漏,接下来慢慢的缩小搜索的范围,力图使不断缩小范围的结果与自己想要的有效信息重合,上面的两个命令非常有用,多多练习。学搜索爱搜索用搜索改变生活。(SS3721)