请选择 进入手机版 | 继续访问电脑版

搜索爱好者

 找回密码
 注册会员

QQ登录

只需一步,快速开始

查看: 6365|回复: 0

必备技能之学会搜索(一)[转载]

[复制链接]
发表于 2015-8-1 00:17:22 | 显示全部楼层 |阅读模式

搜索学术论文~搜索各种东西~是这个时代必备的技能~这篇文章呢~来自一位朋友的推荐~文章来源于大名鼎鼎的1024社区……咳咳……性果然是人类最大的驱动力~!但是!不管来源!文章是写的很好的!下面让我们进入正题!




[size=0.8em][size=1em]目录
[size=0.8em]ChineseTed


一 GOOGLE 简介

二 GOOGLE 特色
三 基本搜寻: +, -, OR
四 辅助搜寻:万用符号、大小写、句子、忽略字符以及强制搜寻
五 关键词搜寻技巧
六 进阶搜寻: site , link , inurl , allinurl , intitle , allintitle
七 少用进阶搜寻语法: related , cache , inforelated
八 其他重要功能
( 一 ). 目录服务
( 二 ). 新闻组( USENET )搜寻
( 三 ). 搜寻结果翻译
( 四 ). 搜寻结果过滤
( 五 ). PDF 档案搜寻
( 六 ). 图像文档搜寻
( 七 ). 找人
( 八 ). 找软体
( 九 ). 找图片
( 十 ). 找 MP3
( 十一 ). 找书
九 GOOGLE 搜寻 FAQ


百度和 Google 的搜索技术是一个量级吗?

很多答案是从使用上讲的,我加两个技术方面的。

搜索引擎需要对抓取到的结果进行管理。当索引结果越来越多时,保证存储和查询速度,保证数万台服务器内容一致的难度越来越高。Google于03至06年左右公布了
三篇论文,描述了GFS、BigTable、MapReduce三种技术以解决这些问题。由于Google并没有公布算法细节,因此由雅虎牵头,在06年左右建立了开源项目Hadoop,
目的是根据Google的三篇论文,实现一个大规模的管理计算系统。但直到08年,Hadoop同Google公布的一些关键指标仍有几倍的差距。百度曾经由王选院士的一个
博士带领,想基于Google论文独立实现(金字塔计划)一个自己的系统,但开发难度过大项目夭折,最终也转向了Hadoop。如今,Amazon、Facebook、Yahoo包括百度
都在大规模应用Hadoop,而Google已经从2010年开始迁移到新的三驾马车Caffeine、Pregel、Dremel上了。单就搜索技术而言,Google不是领先百度,而是领先全世界。


2009-2012年,Google公布了世界上第一个全球化的数据库系统Spanner,这套系统将分布在全球各地的数据中心连接到一起,利用原子钟和GPS,打破了地理间隔,实现
了全球规模具有一致性和实时性的数据库。在Google之前,很多人认为这种系统不可能做出来,但Google做到了[1]。

另外,除了搜索,Google在深度学习和机器人方面也是全球领先的,尤其是后者。尽管百度也有深度学习研究院,但在这两方面跟Google比起来完全是空白。


事实上,让百度来和谷歌比是很不公平的,搜索只是Google的一个部门,但却是百度一整个公司。Google的竞争对手是Apple、Amazon、Facebook和Microsoft,百度的竞争
对手是360、搜狗。Google没了搜索,还有Chrome、Android、Youtube,百度没了搜索,那就什么都没有了








0.site

site:是SEO 最熟悉的高级搜索指令,用来搜索某个域名下的所有文件。

格式:要搜的的内容 空格 site:(冒号为英文格式的冒号但是用中文的也无所谓)网站域名(去掉网址的www,没有www直接使用)


如:搜索我前几天发的帖子







有人说,我是会员可以利用论坛自己来搜索,那么请问你晚上8点到凌晨1点时突然搜索怎么办,大家都知道这个时间论坛为了缓解服务器压力是不让搜索的,这是就可以用这种搜索,还有游客也可以自己这样搜索,还有你想搜索其他论坛但是没有账号不让搜索这种方法也可以,谷歌有个站内搜索插件原理是一样的,基于谷歌的斯特搜索。

1.压住〝S〞,鼠标放在图片上点右键,可以在Google搜索图片的出处。(仅限于Windows系统下的Chrome浏览器)

当你看到某个朋友的图像很喜欢时,就可以随手一搜找找出处,以我图像为例吧









2.搜索图片,可以在Google图片搜索中,把图片拖到搜索框内搜索。(试用于各种操作系统下的Chrome和Firefox网络浏览器)










3.使用Google.com其它国家主页:


巴西 www.google.com.br

日本 www.google.co.jp



google各国网址

链接: http://pan.baidu.com/s/1hqqYvFe 密码: mup7







4.让Google搜索界面翻转、倾斜等,在Google搜索栏中输入〝do a barrel roll〞、〝tilt〞、〝recursion〞、〝anagram〞,你将看到惊奇。(适用于Chrome/Firefox)

这个不好演示,大家自己尝试,很有趣,就是个新鲜感,原来还有这么多不知道

5.双引号,这样的方法可以提高准确度,找到更符合自己关键字的资源

把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。bd和Google 都支持这个指令。例如搜索: “seo方法图片”


下面举个简单的例子,看看差别

这是上面方法的搜索



看看准确度






再来看看没有加引号的区别





结果就不一样了








6.减号

减号代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。Google 和bd都支持这个指令。


例如:搜索 -引擎

返回的则是包含“搜索”这个词,却不包含“引擎”这个词的结果





再来看看 引擎 -搜索





7.星号

星号*是常用的通配符,也可以用在搜索中。百度不支持*号搜索指令。

比如在Google 中搜索:搜索*擎

其中的*号代表任何文字。返回的结果就不仅包含“搜索引擎”,还包含了“搜索收擎”,“搜索巨擎”等内容。








8.inurl


inurl: 指令用于搜索查询词出现在url 中的页面。bd和Google 都支持inurl 指令。inurl 指令支持中文和英文。


比如搜索:inurl:搜索引擎优化

返回的结果都是网址url 中包含“搜索引擎优化”的页面。由于关键词出现在url 中对排名有一定影响,使用inurl:搜索可以更准确地找到竞争对手。







9.allintitle

allintitle:搜索返回的是页面标题中包含多组关键词的文件。


例如 :allintitle:SEO 搜索引擎优化

就相当于:intitle:SEO intitle:搜索引擎优化

返回的是标题中中既包含“SEO”,也包含“搜索引擎优化”的页面





10.allinurl

与allintitle: 类似。

allinurl:SEO 搜索引擎优化

就相当于 :inurl:SEO inurl:搜索引擎优化






11.filetype

得到pdf,xml,xls,txt,doc,mdb,csv ,xls类特定格式结果

如: filetype:pdf

filetype:sql

这个再结合 site 和inurl 一起使用更强大,很多大型数据包都被谷歌收录过。

filetype :csv site:某网盘 或资源站点 inurl:某url特征。

site:某酒店第三方管理企业站 inurl:shifenzheng.csv (这个只是举例,用好谷歌加点社工和技术好像能做的很多)

site:某酒店第三方管理企业站 filetype:csv



工具和方法得结合人的思维和目的,然后才会有一个满意的结果。

用于搜索特定文件格式。Google 和bd都支持filetype 指令。

比如搜索filetype:pdf SEO

返回的就是包含SEO 这个关键词的所有pdf 文件。






12.linkdomain

linkdomain:指令只适用于雅虎,返回的是某个域名的反向链接。雅虎的反向链接数据还比较准
确,是SEO 人员研究竞争对手外部链接情况的重要工具之一。


比如搜索

linkdomain:http://cnseotool.com -site:http://cnseotool.com

得到的就是点石网站的外部链接,因为-site:http://cnseotool.com 已经排除了点石本身的页面,也就是内部
链接,剩下的就都是外部链接了。





13.related

related:指令只适用于Google,返回的结果是与某个网站有关联的页面。比如搜索

related:http://cnseotool.com

我们就可以得到Google 所认为的与点石网站有关联的其他页面。 这种关联到底指的是什么,Google 并没有明确说明,一般认为指的是有共同外部链接的网站。


上面介绍的这几个高级搜索指令,单独使用可以找到不少资源,或者可以更精确地定位竞争对
手。把这些指令混合起来使用则更强大。





14.inurl:gov 减肥

返回的就是url 中包含gov,页面中有“减肥”这个词的页面。很多SEO 人员认为GVM和学校网
站有比较高的权重,找到相关的GVM和学校网站,就找到了最好的链接资源。

下面这个指令返回的是来自.中国教育和科研计算机网CERNET,也就是学校域名上的包含“交换链接”这个词的页面:

inurl:.中国教育和科研计算机网CERNET 交换链接

从中SEO 人员可以找到愿意交换链接的学校网站。

或者使用一个更精确的搜索:

inurl:.中国教育和科研计算机网CERNET intitle:交换链接

返回的则是来自中国教育和科研计算机网CERNET 域名,标题中包含“交换链接”这四个字的页面,返回的结果大部分应
该是愿意交换链接的学校网站。

再比如下面这个指令:

inurl:中国教育和科研计算机网CERNET*register

返回的结果是在.中国教育和科研计算机网CERNET 域名上,url 中包含“forum”以及“register”这两个单词的页面,也就是
学校论坛的注册页面。找到这些论坛,也就找到了能在高权重域名上留下签名的很多机会。

下面这个指令返回的是页面与减肥有关,url 中包含links 这个单词的页面:

减肥 inurl:links

很多站长把交换链接页面命名为links.html 等,所以这个指令返回的就是与减肥主题相关的交换
链接页面。

下面这个指令返回的是url 中包含http://gov.cn 以及links 的页面,也就是GVM域名上的交换链接页面:

allinurl:gov.cn+links

最后一个例子,在雅虎搜索这个指令:

linkdomain:http://cnseotool.com -linkdomain:http://cnseotool.com
返回的是链接到点石网站,却没有链接到我的博客的网站。使用这个指令可以找到很多连向你
的竞争对手或其他同行业网站,却没连向你的网站的页面,这些网站是最好的链接资源。
高级搜索指令组合使用变化多端,功能强大。一个合格的SEO必须熟练掌握这几个常用指令的
意义及组合方法,才能更有效率地找到更多竞争对手和链接资源。

找外链的时候你可以用这几种命令组合,例如site:.com inurl:blog “post a comment” -”comments closed” -”you must be logged in” “输入你的关键词“,
site:.com 是 指, 只显示.com的网站。 如果你想要 org的链接,就换成 site:.org,inurl:blog 是指博客。


“post a comment” -”comments closed” -”you must be logged in” 是指, “能够写评论的” 减去“ 关闭评论的” 再减去“ 必须要登录才能写评论的”。



大家还有什么更高级的命令可以补充!!!!


15.



如何使用谷歌搜索,不同的人有不同的看法和经验,下面补充看看这位网友分享的图文介绍,希望大家多少能了解一点。


(1)首先要掌握工具,包括熟悉常见的Google语法(如""、site、filetype)和工具(如图片搜索、Google Alert、Google Trends)。关于基本语法,请见附图。

(2)其次要积累关键字。每个专业领域内都有一些专业术语,而这些术语出现在媒体或口语中都是俗称,要想查到高质量的结果,就要有把术语和俗称进行转换的能力。另外,经过长期检验,有一些专家和记者非常靠谱,在搜索问题时同时加入他们的名字,得到的结果质量会高很多。

(3)掌握了工具和关键字后,要知道二者如何配合使用。比如需要查找一份政府文件,如果知道准确的文件名,就可以加半角引号进行精确检索;但如果不知道准确名称,就可以用site语法只在政府网站内用相关关键字查询,而不是在全网大海捞针。什么时候需要扩大搜索范围,什么时候需要缩小搜索范围,是使用具体语法,还是减少或增加关键字,都需要经验的积累。如果每次搜索时都有意识的、层层推进的而不是盲目的,分析问题的能力也会有提高。

虽然有质量很高的收费法律数据库可以用,我还是很喜欢用Google进行搜索,因为随着搜索次数的增加,搜索效率是能够不断提升的。关键就是要不断总结,查到了以后要“复盘”,看看有没有更快更准确的方法,查不到要思考为什么查不到,隔一段时间换别的语法或关键字再试试。




您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

Archiver|手机版|大川乒乓网|中文搜索引擎指南网(搜网) ( 鲁ICP备16006309号

GMT+8, 2017-12-19 02:37 , Processed in 0.106933 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表