请选择 进入手机版 | 继续访问电脑版

搜索爱好者

 找回密码
 注册会员

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 7277|回复: 3

讲一讲,如何使用搜索引擎去筛选我们感兴趣的信息

[复制链接]
发表于 2016-5-15 01:14:44 | 显示全部楼层 |阅读模式
2016-05-12 果然翁 小果然随便写

这篇文章主要想讲一讲,如何使用搜索引擎去筛选我们感兴趣的信息。

王师兄在朋友圈发状态,说有个小灾小病,比起查百度,还是CNKI更靠谱,呼吁大家都学习一下操作方法,关键时候能保命,说不定连破财免灾都省了。

然后我就突然想起来,之前花了一夜的时间,在家买的那个用起来感觉还不错的榨汁机之后,妈妈问我,怎么去查什么东西好啊。

我当时说,这个我一两句真说不明白。

不过最近听到一些对百度竞价排名等相关问题的抨击,以及最近莆田系私通三甲医院却被百度背锅之类的小道评论,突然觉得,或许换一个角度去尝试,也未必说不清楚。

所以,这篇文章的重点,并不是从技术角度如何使用各种搜索引擎(包括搜索的时候怎么用空格分号减号等),而是想借着检索信息这件事,说说什么信息有用,去哪里找,怎么甄别。

我本来写了一大堆关于数据、元数据的区分、特点的内容,但是考虑到里面也没有太多的干货,就不耽误大家时间了。整理一下,我删掉的内容由以下两个部分组成:

1、你得知道你想要查找、鉴别的信息,是什么,而不是看上去好像是什么。

2、你得分清楚,这个信息本身是怎么回事,和别人说这个信息是怎么回事,之间的区别。


能搞明白、能分清的自然没问题,如果不能,那也不是一两个长文能搞定的事情,所以暂且这样。

我决定用几个例子来说一下,如果你打算快速搞懂某个事情,应该怎么做。







 楼主| 发表于 2016-5-15 01:15:25 | 显示全部楼层


1、我要买一个乒乓球拍,预算300以内,右手拿拍子,想要个厉害的。

对这个问题,我们百度,搜“买乒乓球拍”。我们首先可以依赖百度知道或者百度经验,不过无论哪一个,我们要分清楚,在第一步,我们首先要做的事情是描述我们的问题,而不是看别人给出的答案。

(记得,百度的前几个答案,如果点开之后让你觉得有些烦人而非对你爱理不理,通常是有问题的。详细判断什么信息有价值,我后面会简单说一下)


整理前几个链接里的信息,我们大概得到这么几个内容:拍子的材质,打球的技术,通常是买乒乓球拍这个问题上主要思考的问题。一些答案里面还给出了一些推荐,我们挑几个记下来,比如斯蒂卡OC配狂三。

然后,我们在“基本”了解了我们所要解决的问题之后,要“基本”了解一下,其他人是如何解决这些问题的,他们对这些解决方案如何评价。百度搜“斯蒂卡OC”,再搜“狂三”(过滤掉和乒乓球无关的内容。或者可以搜“狂三 乒乓球”,在你不知道狂三实际上叫狂飙三之前),看看其他人如何评价这些东西。


在看完若干个页面之后,或者到你看烦了觉得这些人也没说什么有用的东西的时候,你大概会接触到很多你不明白的新词汇,比如“快弧弧快”,比如“直板横打”,比如“灌胶”,或者“正反反长”。这个时候,提出新的问题:什么是……呢?按照第一步那样,试着去简单地解决这些问题,比如百度搜“正反反长”,然后你就了解了削球的新打法。当然,这个过程之中会引入大量的新词汇,你可能需要一个笔记本记一下相关的信息,又或者,在你的浏览器里保留之前的搜索结果,不要急着关闭它们。


在你解决这些新问题的时候,脑子里要时不时地闪过这样一个问题:这个新的问题有必要解决么。在了解某个问题和你最核心问题的关系之后,你通常会很轻松地做出这个判断。比如“正反反长”,你查到这是削球手的乒乓球拍配置方案之后,如果你不打削球,你就可以不再关注这个问题了。


在经过这四步之后,你对一开始的那个问题,通常就会有一个树形的、有根有叶的知识结构了,这个时候,你要开始尝试自己来解决这个问题,看看是不是能得到和别人说的类似的结论。比如配置乒乓球拍,虽然底板很多套胶很多,但是最后大家配出来的往往都是五木二碳配狂三之类的老套路,那你在自己选择配置的时候,是否也能得到一样的结论?如果不能,是你出了问题还是别人出了问题,又或者你的需求确实和别人不一样?

这五步,足够我们解决大部分的,不需要专业知识,只依靠互联网上的信息即可解决的问题——类似的还有“我该买什么榨汁机”,“我想吃烤鸭北京哪家好”甚至“我喜欢一个女生但不知道该怎么和她说话我该怎么做”。通常,解决问题时,需要我们对一个问题有全面深刻的认识,而这五步,其实是一个微缩版的建立知识结构的方法——穷举问题,剪枝控制复杂度,求得最优解。









 楼主| 发表于 2016-5-15 01:16:30 | 显示全部楼层
2、“据报道,跑步损伤发生率目前已高达92.4%,跑步成为高危险运动”是真的么?

我专门找了一个百度之后在第一页找不到辟谣文章的消息,以区别于诸如“虾和柠檬不能一起吃”或者“微信群要取消了赶紧备份”之类的村断网类谣言。

在开始后面的问题时,我首先得让大家清醒一下,那就是断言性结论和断言性评论是不同的。比如,“一氧化二氢是酸雨的最主要成分”这句话,是一个断言性结论,不包含任何主观情绪和主观判断,无论这个信息是否有价值,都不妨碍它作为一个结论存在,而结论或对或错或无法验证,总是有个定论的;而那些评论性的话,比如“这个手机是世界上第二好用的手机”之类,往往缺乏这种确定性和准确性,你说他不对吧,他总能自己把自己的话圆回来——或者更进一步说,如果一句话不具有可证伪性,总是能自圆其说,却又无法推翻什么现有的东西、创造新的东西,那他或许连被推翻的价值都没有,随他去就好了。

回到跑步的问题。


判断一个命题是否正确,有的时候根本不需要我们动太多的脑子,毕竟这世界上聪明人有的是,百度搜一下,很大几率就能搜到针对一个命题的证伪论述,大部分的造谣,用这个方法连一分钟都挺不过去。


但是放到跑步这个问题上,这就有些复杂了。一个命题本身是一个评价,那我们往往没办法对这个命题是否正确进行评判。这个时候,我们要评判的,是这个命题是否有价值,是否有能力指导我们日后的实践。

第一步,查一查这个命题是哪里来的。比如,你看到一个信息,说“对深度学习的众多描述中,最不喜欢的就是说机器学习像大脑一样工作”,这句话对么?你不懂,没关系,我们查这句话是谁说的。查完了,发现是杨乐村(yann lecun),你不认识他是谁,好的,我们开始调查这个信息来源。这一步有一个关键的要素:一方面看一个人的出身,一方面看一个人的成就。出身不是绝对的,但是一个出身好的人,往往比没有出身的人更能做出好的成就;而一个人获得的成就,则是白纸黑字一样证明一个人能力的最主要手段。记着,这世界上有大量的伪造出身伪造成就的方法,所以对“如何评价一个信息来源是否可靠有价值”这个问题,建议如果有时间的话,按照第一个问题那样,查一查。


或许你在第一步查出来了,乐村同志是机器学习领域的大神,大概相当于木工界的鲁班,那这句话虽然依然有可能出错,但是一个专业领域的领军人说的话,几乎代表着这个行业最前沿最权威的说法,这一般是很难撼动的。

但是如果,你没有查到命题的来源,你就需要进入第二步:这个命题是否有价值。比如有说法说,“千滚水里面的亚硝酸盐含量很高会对身体有危害”,我们找不到命题来源,那我们就要想想,这个命题是否有价值。
判断命题价值有两个非常有效的标杆,一是“抛开剂量谈毒性的都是耍流氓”,二是“不能推出新结论的断言都没卵用”。


对前者,比如“大量摄入一氧化二氢可能会致人死亡”,假设你不知道一氧化二氢是什么,假设,那我们看看,这句话说大量的时候,说了多大量了么?没有。那说了对照试验了么?记不记得一个段子,说把小白鼠放到一个烧瓶里,扔进去一个烟头然后盖紧盖子,过了一小会儿小白鼠就死了,其实是憋死的?同样,千滚水里面的亚硝酸盐含量更高,但是到了致死剂量了么?要喝多少千滚水才会对人体产生危害?如果一个命题抛开这些来谈结论,并且你查都查不到相关的数据信息,那这个信息几乎肯定是没用的。


对后者,妄议宗教问题违背基本法,我可是要闷声发大财的人,我说这么个例子,比如有人说,“人怎么可能是猴子变来的”,这类问题,往往命题中包含着一套自圆其说的逻辑,你推翻不了他也证明不了他,仿佛只能静静地看着他。判断这种命题是否有价值,要看他是否能指导实践。比如中医,中医的各种核心理论,拿西医那套是没办法说通的,但是中医自圆其说,西医只能眼巴巴看着它搞什么经络啊内息的。那好,你觉得中医有用,那你用中医治病啊,如果有确实的方法证明中医能治病,我才服你。









 楼主| 发表于 2016-5-15 01:17:56 | 显示全部楼层
3、如何评价(或者鉴别)“我是一个来自河南的伊斯兰女博士生,这是我的故事”之类的文章?
类似的还有“你可曾想过,你的每一分钱,下一秒都可能变成打进你身体里的那颗子弹?”之类的说法。



我甚至都不知道该怎么找一个切入点来说这些事情,因为就我而言,这类话真的跟笑话一样,已经谈不上信不信了,我都懒得推想说这些话的人脑子里到底少了什么东西——又或者可能只是有人想装傻充愣开自己一个玩笑吧,那我就陪着笑一笑好了。


不过早在七八年前,网络钓鱼时代刚刚开始的时候(还记得让人别穿秋裤的故事么),钓鱼党党魁就表示,钓鱼是要留下显而易见的破绽的,不然和造谣无异。比如前面我提到的,“一氧化二氢是酸雨的主要成分”,这个钓鱼就是有明显破绽的,没学过化学的可能不少,不知道水是氢二氧一的可真的不多,对吧。

但是呢,现在很多的谣言(真的为了造谣儿造谣那种,而非误传之类的),在形式和内容上,已经越来越复杂、越来越难以识别了,所以这里我觉得或许可以通过列举几个恶意谣言相关的信息,来给各位读者理一理思绪。

不知道有没有用就是了。

3.1、谣言可以看做一种病毒,他的目的是让你传播他。


抛开谣言不谈,我说前两天看到的一个闹心的事吧——有人分享了一个信息:“母亲节到了,祝母亲健康长寿的转起来,没娘的就不用转了。”


不予评价。

我听说过一个外国的电脑病毒,是一封邮件,打开之后你会看到这样的内容:“这是一个来自XXX的电脑病毒,你已经中毒。但是我们没有开发真正的电脑病毒的技术,所以如果你支持我们,请随便删除电脑里的一些东西,然后把这个邮件转发给你的朋友,谢谢。”


我觉得这个病毒挺萌的。不过,这还是病毒,是具有传染性和破坏性的病毒。

有用的信息提供信息量,而且不会在意自己是否被传播了;无用的信息,或者以传播为目的的信息,更或者被大量传播之后会产生各种影响的信息,才会上赶着让你去传播他,甚至不惜使用各种龌龊的方式。
就这么简单,希望大家能想通。


想通之后,麻烦看到那些怂恿你转载的文章时,多留一个心眼。



顺带送一个笑话:


抗战时期,东北有一名著名的二人转老艺人。当时东三省沦陷,鬼子大摆庆功宴,点名要老艺人来表演助兴。老艺人誓死不肯答应,最后鬼子无奈,交给了他一张纸条,老艺人看后大哭:“这帮王八犊子尼玛也忒狠了!”只见纸条上写了七个大字“不转不是中国人。”

3.2、谣言往往是若干个谎言的组合。


或许大家会觉得,一个谎言都容易识破,那好几个放在一起,难道不是更容易被识破么?不是的,因为大部分人的脑子是装不下那么多的东西的。


比如我说,“今天是马化腾的生日”,按照之前咱们说的第一第二条,你可能查一下马化腾的生日到底是几号,就知道这是个谣言了;但是如果我说,“今天是腾讯老总生日,将此消息转发到五个QQ群,就会送你两个太阳,而且可以获得5个Q币,马化腾还会向希望工程捐赠3.8元现金,快点转发,让孩子们能在敞亮的教室里上学吧!”这句你读完了,你知道你该查哪一句甚至那几个词是谣言么。



初中开始写议论文,研究生开始写论文,不过什么文章都一样,一篇文章只能有一个中心观点,所有的内容都是围绕着这个观点进行论述的——甚至洋洋洒洒数十万的一部小说,总结起来往往也只有“侠义”或者“过瘾”二字。


然而很多谣言文章,却总给人一种不知道他想说什么的感觉——你单看哪一句好像都有点道理,合到一起吧,怎么都不是人话。



不过反过来说,其实有的文章哪句话看着都没关系,但是最终却都有同样的一个目的:让你转发。这么看是不是就简单了?


看你看得明白不明白了。



3.3、最可怕的谣言,是用真事说假话。

这条真的让我不寒而栗。


但是一想到我只是打算说朋友圈之类的地方出现的骗中老年人转发为目的的谣言,不需要涉及社会文化历史事件政治问题,我就稍微轻松了一些。

举个简单的例子。


“你买一杯洋酒的钱,刚好够洋人制作一颗散弹枪子弹,可以在你的胸口开一个直径十公分的洞。”


现编的。为什么酒吧里面的小杯子叫一发(one shot)呢?因为以前的酒吧也买卖子弹,一小杯伏特加的价格还真的就等于一发散弹枪子弹。我这句话里面,没有假话。但是我把它们组合起来,表达的意思,是不是就变味了?

身为一个没有细致调研过相关信息的人,你可能不知道转基因、电磁辐射、PX或者秋裤是否有危害,可是就算你是业内的行家,你也只能知道,这些东西对你的身体是否有害,是个不确定的事情——联系前文,我们没有谈计量,而且像是转基因之类的技术,就算谈计量我们也说不清他有害无害(当然崔永元之流并不会在意学术研究的成果,屁股决定脑袋嘛)。


在这个场景下,如果有人跟你说,“现在不确定转基因食品是否安全,美国把大量的转基因食品卖给外国,自己却在研究非转基因作物”,这句句实话的三个命题,是否让你得出了“美国人真坏,转基因食品不能吃”的结论?

最聪明的人,说实话,来引导蠢货们为他们服务。


身为蠢货,我们最好始终别忘了,自己什么都不懂,别随便信别人的话。


倒不是说我打算说谁是蠢货,只不过面对大量的我们不了解的问题,与其假装自己聪明明白事儿,倒还不如承认自己实际上并不了解——大家都有朋友啊,去问问了解的人,不就能让自己稍微变聪明一点么?

就这么多吧。感谢阅读。








您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

Archiver|手机版|大川乒乓网|中文搜索引擎指南网(搜网) ( 鲁ICP备16006309号

GMT+8, 2017-2-24 11:46 , Processed in 0.100838 second(s), 21 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表