搜网全能搜,帮您一键实现对百度、google谷歌、360搜索、搜狗、搜搜等搜索引擎及影视娱乐、图片、音乐歌曲、问题知识、论坛、微信、微博、淘宝网上购物等热门网站搜索,方便快速找到您需要的东西!

 

 

·收藏本站
·网站推广
·搜索论坛

   首 页 - 搜网全能搜 - 搜索引擎大全 - 搜索入门到精通 - 搜索引擎登录 - 搜索爱好者
    

怎样利用互联网学习和研究

  http://www.sowang.com  作者:朱颖 2004年5月24日 来源:天极网络专区


   

  全世界的人们在互联网上就无数论题提供了海量信息。在互联网上,用户可以访问到大量信息:大量的信息资源,电子邮件,文件传输,兴趣小组成员,交互式协作,多媒体展示等等。互联上包含多种连接协议。这些协议包括e-mail, FTP, HTTP, Telnet和 Usenet新闻。 多数协议都有配套的支持程序,可让用户搜索和存取信息资源。

>

  要了解互联网访问协议的背景知识,请参见《了解互联网》。

  互联网并不是一个其中所有的资源已经分门别类,且可以从目录中检索的图书馆。 事实上,没有人了解互联网上有多少个文件。这个数字至少有数十亿,且正在快速增长。

  互联网是一个自我发布的媒体。这意味着任何人只要有一些技能,就可以在互联网上的一台主机上发布信息。在你进行研究,寻找站点的时候,重要的是要记住这点。互联网站点的内容可根据创建者的喜好和承诺,随着时间可能会有改变。有些站点介绍专家领域的知识,而有些站点则是业余爱好者的天堂。有些站点也许会每天更新,而有些站点则是老面孔。对于这些资源,要评估所找到的信息的重要性。

  注意互联网的地址经常会有变化,有的网站会消失掉。不要指望互联网是稳固不变的。

  在互联网上开展研究的一个最为有效的方法就是使用全球网(WWW)。因为该网络包含了最重要的互联网协议,全球网提供了互联网上的大部分信息。

本文主要内容
在互联网上如何寻找信息
1、如果有网址,就直接访问该网站 2、浏览
3、探索主题目录 4、使用Web搜索引擎,开展研究
5、探索“深度Web” 6、加入电子邮件讨论组或者USENET新闻组
WEB搜索引擎实战
1、如何形成查询语句 2、进行搜索的11条技巧

 

  在互联网上如何寻找信息

  要在互联网上获得信息有不少基本方法:

  1 如果有网址,直接访问该网站

  2浏览

  3探索一个主题目录

  4使用网络搜索引擎进行搜索

  5在Web上的数据库中检索信息,即所谓的“深度Web”

  6 加入 e-mail讨论组或者 Usenet新闻组

  下面将详细介绍上面的每一个方法。
 

  1. 如果有网址,就直接访问该网站

  如果你知道要访问的网站的网址,可以使用 Web浏览器来访问该站点。需要的是在地址窗口输入该URL。URL代表统一资源定位符( Uniform Resource Locator)。 URL指明了对应的电子文档的互联网地址。互联网上的每个文件,无论其访问协议是什么,都有一个独一无二的URL。 Web浏览器使用 URL来存取主机目录中的文件。该文件随之显示在用户计算机的屏幕上。

  URL的格式为 protocol://host/path/filename

  例如:

  http://www.yesky.com/ServerIndex/77131840200114176/index.shtml ——Web中的一个超文本文件

  ftp://ftp.uu.net/graphics/picasso —— 一个FTP站点中的文件

  telnet://www.mysite.com —— 一个Telnet连接

  可以在Web浏览器的地址窗口进行输入上面这些地址。

  2. 浏览

  浏览Web主页可以找到有用的信息,这个方法虽然有趣但不常见。 因为链接是由主页的创建者设定的,你不会预先知道这些链接会连接到哪里。质量高的起始页面通常包含高质量的链接。大学图书馆的网站就包含了链接到Web中的好的链接,这是你开始探索的好地方。

  3.探索主题目录

  越来越多的大学,图书馆,公司,机构,甚至志愿者正在创建主题目录,以便对互联网上部分信息进行分类。这些目录按着主题分类,包含着同这些主题相关的互联网资源的链接。Web上的主题目录存储在有重复但各不相同的数据库中。大多数主题目录提供搜索功能,可以让用户根据需要查询数据库。

  何时使用主题目录?对于一般的,需要探索的论题,以及供用户浏览的论题,主题目录是有用的。

  有两种基本类型的主题目录:学术和专业目录通常由行业专家创建和维护,以便为研究服务,而商业门户网站中包含的目录通常是为了满足普通大众的需要,且为了吸引用户的访问量。你需要判断有关主题目录是否适合你的需要。

  位于美国加州大学的INFOMINE,就是一个学术性的主题目录的范例。

  Yahoo就是一个最著名的商业门户的例子

  不同的主题目录在内容选择方面,差别很大。例如著名的Yahoo在添加网页到其数据库中时,对于用户提交的内容并不作仔细审核。因此它不是一个可靠的研究资源,且不应该用作研究。而INFOMINE仅选择对于学术和研究团体有用的资源。需要考虑到你所访问的目录的搜集策略。对于这个问题的一个挑战是:不是所有的目录服务供应者都愿意披露其搜集策略,同样他们也不愿意透露对其网站进行评论的人的身份和资质。不少主题目录包含描述或者评估网站内容的注解的链接。来自知名评论人士的质量好的注解比诸如Yahoo! 这样的由网站创建者写的注解更有价值。

  某些目录是多年来的人们的智力劳动成果的结晶,了解这一点是有用的。所以,当在Web上开展研究时,查询主题目录是很重要的。

  建议:

  如果你打算查找大量的资源,可以试一试 图书馆的互联网索引 。由美国联邦政府支持的该索引,搜集了大量的加州图书馆的资源,以及对大量论题的网络资源的注解。 经过精心的和细致的搜集整理,加上其客观的富有价值的注解,以及层次化的组织,使得该索引成为“知识界的 Yahoo”。

  WWW虚拟图书馆是网络上最久远的,也是最令人动心的主题了。其目录包含了单个的主题的集合,其中不少主题是由位于全球的大学来维护的。

  INFOMINE 是一个由加州大学维护的大型学术网站目录,该目录可以通过主题,关键字,或者标题来浏览。对于每个列出的网站都有描述。
 

 4. 使用Web搜索引擎,开展研究

  一个互联网搜索引擎可以让用户输入同论题相关的关键字,查到包含相关信息的网站。有多种支持各种互联网协议的搜索引擎。例如,Archie用于搜索存储在匿名FTP网站中的文件。

  目前,Web本身已经成为互联网环境的首选,位于Web中的搜索引擎越来越受到欢迎。Web搜索引擎能够提供位于互联网中的大量网站的信息。不少搜索引擎汇集了多种互联网协议的数据库,包括HTTP, FTP和Usenet。它们也能够在Web中深入搜索到多媒体或者其他类型的文件,且可进行单项搜索。虽然Web搜索引擎主要由私营公司开发,但其中的大多数是免费的。

  一个Web搜索引擎包含三个部分:

  爬虫:能够从一个链接到另外一个链接,遍历网络,且识别和阅读网页的程序。
  索引:包含由爬虫搜集的网页的副本的数据库
  搜索引擎机制: 可以让用户查询索引的软件,通常根据相关度返回结果。

  注意爬虫程序是不加选择地进行遍历的,要知道一些搜集到的资源可能是过时的,不准确或者不完整的。剔除这些不准确的资源,其他的查到的资源当然是有根有据的和有价值的。需要仔细评估所有的搜索结果。

  大多数搜索引擎使用时,是在搜索项中填写表格,之后请求搜索。该搜索引擎查询其索引,之后生成一个包含你的搜索项的部分或者全部内容的链接资源的页面。这些资源列表的排列通常是有次序的,对于搜索内容的打分比较曾经是个流行的方法,如果你的搜索项在一个文档中(包括在文档的标题中,在文档的开始,在文档的结束位置等)出现的次数越多,那么该文档在就在搜索结果列表中就越处于开始的地位。 这类引擎被认为是第一代搜索引擎。

  在搜索引擎技术中更为复杂的一项技术是根据概念,关键字,网址,链接或者流行度来对搜索结果排序。支持这些功能的搜索引擎被认为是第二代搜索引擎。这些搜索引擎对排序结果进行了改进。这是因为在决定相关度的时候,需要加上人为因素。例如,Google根据链接到其他页面的网页的排序得分对搜索结果进行排序。 如果有其他得分高的页面链接到该页面,那么该页面的得分就高。这个策略结合了技术和人为的判断。

  所有的搜索引擎都有查寻规则。在开始搜索之前,你需要阅读帮助文件,在线教程也可以帮助你学会这些规则。本文的最后列出了一些推荐教程。

  建议

  从Google开始。这是个著名的第二代搜索引擎,其页面的排序是基于热门网页链接到的数量来决定的。包含这些链接的网页越热门,该页面的排列位置越靠前。这些热门网页的排列位置同样也是这样确定的。 这里用到的思想是:高质量的网页可以通过另外一个高质量的网页的链接找到。Google在市场上大获成功,这就是该排序理念的见证。

  另外一个有趣的链接排序引擎是Teoma。该搜索工具把搜索结果组成为三个部分:按照得分高低排序的网页列表,专家给出的相关网站的链接, 以及基于论题关键字的概念分类。这些分类是动态生成的,可以细化你的搜索结果。排序同Google有些不同,Teoma在搜索论题时,在同一类别中来对网页排序。 它们被称为“特定主题的流行度”。

  如果你的论题不太明确,或者你打算一次用一个搜索语句获得多个搜索引擎的结果,那么Ixquick 是个好去处。该服务同时使用多个搜索工具,并返回剔除了重复页面的搜索结果。这种搜索处理称为元搜索。值得一提的是:Ixquick在源搜索服务中,仅仅返回最靠前的10个相关结果。这就意味着你一次可以使用多个搜索引擎来查询。其他推荐的元搜索引擎包括 VivisimoProFusion
 

 5. 探索“深度Web”

  “深度”或者“不可见”Web的概念近来开始浮现,这是指存储在Web数据库中的,但搜索引擎访问不到的内容。换句话说,对于搜索引擎来说是“不可见”的。不同于检索静态页面,爬虫程序无法进入到数据库中检索内容,以往,这些数据库数量少,被称为专门数据库,主题数据库等。

  在不可见Web中访问信息的最好方法是搜索这些数据库,这些数据库包罗万象,从学术资源到商业信息。近来,动态生成的信息很可能是存储在数据库中,包括新闻,求职信息,飞机航班信息等等。随着通过Web访问的数据库数量的增加,通过数据库来在Web上寻找信息将成为主流。

  其他未被爬虫搜集的内容包括非文本文件,诸如多媒体文件,图像文件,以及象PDF这样的非标准格式文件。Google对此是个例外,它可以检索到PDF, Word和其他文档。

  注意:不少搜索引擎网站以及商业门户网站把能够搜索深度Web作为其服务项目之一,这种内容汇集是大势所趋。例如,你可以访问AltaVista,查找新闻,地图,职位信息,拍卖,购物信息等等,所有这些都处于爬虫程序搜索的范围之外,另外一个例子,Google把 PDF和Microsoft Office文件的检索功能集成到其通用搜索服务中。

  此处列举了一些能够搜索深度Web的网站:

  The Invisible Web

  http://www.profusion.com/

  拥有超过10,000个数据库的目录,可以搜索你所需要的数据库

  Invisible-web.net

  http://www.invisible-web.net/

  尤其适合于研究人员,拥有高质量的数据库

  Search.Com

  http://www.search.com/

  来自CNET的数十个基于论题的数据库
 

 6. 加入电子邮件讨论组或者USENET新闻组

  加入数以千计的电子邮件讨论组或者Usenet新闻组。这些讨论组涵盖了大量论题。你可以提出专业问题且能够得到来自其他人的回答。加入这些组之后,你每天就会收到一份你所感兴趣的论题的新闻简报。在互联网上,这些讨论组提供了一个很好的途径来跟踪你的专业课题。另外,讨论组可以帮助你找到你需要的信息,无论是在线的和离线的。

  有一些学术机构的电子邮件讨论组,不少论题是关于自然科学的,如果在参与者中找到一些专家是不奇怪的,Usenet新闻组涵盖的论题的范围更广,参与者中有不少专业人士。对于任何论坛中的观点和信息要小心评估。也要注意一小部分电子邮件讨论组也发布到Usenet新闻组。例如,早期音乐电子邮件组EARLYM-L也存在于新闻组 rec.music.early。

  电子邮件讨论组由软件程序管理,常见的程序有三种:Listserv, Majordomo和Listproc。使用这些程序的命令类似。

  新闻组列表可以通过新闻阅读程序访问,诸如Netscape Communicator 这样的Web浏览器也包含新闻阅读器。这就可以在图形环境下方便地访问Usenet。

  有一个很好的,基于Web的目录可以帮助找到电子邮件讨论组和Usenet新闻组,这就是Tilen.et, 网址为: http://tile.net/.

  WEB搜索引擎实战

  如何形成查询语句

  进行数据库搜索需要进行三个步骤:

  1明确你的概念

  当进行数据库搜索时,你需要把你的论题分解成几个部分,例如,如果你打算寻找美国总统布什和民主党之间的预算协定的信息, 这里有三个概念:布什,民主党,预算。

  2对于每个概念,列出关键字

  一旦明确了概念,就需要列出描述每个概念的关键字,一些概念也许只有一个关键字,其他一些概念则可能有若干关键字。

  例如:

  布什

  民主党

  众议院发言人

  预算

  预算协定

  预算争议

  预算僵局

  预算分配

  根据你的搜索重点,也许有其他的关键字。
 

 3 在你的关键字中明确逻辑关系

  一旦明确了进行搜索的关键字,就需要建立这些关键字之间的逻辑关系。此处正式的名称是布尔逻辑。布尔逻辑可以通过使用逻辑运算符 AND, OR和 NOT 来明确搜索项之间的关系。

搜索语句 搜索结果
  World War I AND
  World War II
这两个条件都满足的条件
  World War I OR
  World War II
至少包含其中之一的条件
  World War I NOT
   World War II
包含条件World War I 但不包括World War II的条件

  一些搜索引擎可以进行布尔搜索,但没有显式用到逻辑运算符。 例如,你被要求列出所有搜索条件,并选择搜索所有这些条件。这就表示AND逻辑。指明使用其中的任何一个条件,就表示OR逻辑。大多数搜索引擎使用一种隐含的布尔逻辑,其中用符号或者空格来表逻辑关系。例如, +bears +hibernation 表示 AND逻辑。

  某些搜索引擎可以使用邻近度运算符。这是一种规定了源文件中单词之间的距离的AND逻辑。例如, AltaVista使用NEAR运算符。考虑如下搜索:布什 NEAR预算。在AltaVista中,这两个单词在源文件中相距不超过10个单词。这就可以帮助你在搜索结果中保证了相关度。

  大多数Web搜索引擎不能用一个搜索语句处理包含上面步骤2中的所有条件。 你可能需要使用不同的组合来修正的你的搜索,直到找到满意的结果。例如,你可以从布什,民主党,预算协定开始,用AND逻辑连接这些条件。看看你的搜索结果,如果找不到,,用预算概念中的替换关键字重复上述过程。根据一开始的搜索结果,来看看需要添加哪些新搜索项。

  要了解更多规范化搜索的信息,请参见互联网上的布尔搜索。

  进行搜索的11条技巧

  1在每个搜索网站上阅读指南,搜索的技巧取决于你使用的搜索引擎。在不同的搜索引擎中有大量选项。

  2如果你进行多项条件的搜索,要清楚使用的布尔逻辑类型。例如,关于纬度和温度的关系的搜索在不少Web搜索引擎上可以组合成: +纬度 +温度,采用逻辑AND。

  3 采用逻辑OR时,在搜索语句中包含同义词或替代词。

  4 检查拼写。

  5 如果搜索引擎区分大小写,利用大写的好处。

  6 如不满意搜索结果,用替代词语再次搜索。

  7 尝试从不同的信息源,进行搜索,以便获得多种结果。信息源包括 Usenet新闻组,互联网FAQ,目录中的评论页面等等。

  8 尝试不同的搜索引擎,没有两个搜索引擎在同一索引中检索。

  9 尝试可以同时启动多个搜索引擎的搜索引擎。注意你将失去高级查询选项功能,因为不是所有引擎都支持同一种查询格式。

  10 如果得到的搜索结果太多,或得到不相关的结果:

  • 进行相关领域搜索
  • 添加概念单词,一些引擎支持在现有的搜索结果中再次搜索。 可以在Hotbot或者 Lycos上试试该功能。
  • 使用针对你的论题的单词,除非打算进行领域搜索,避免使用内涵广泛的单词。
  • 使用布尔逻辑运算符AND(+),连接合适的项,这样每一项都出现在搜索结果中。
  • 如果可以的话,使用邻近度运算符寻找文档中靠近的项。Lycos提供了多种搜索项的邻近度选项。
  • 如果搜索项是个语句,用引号把它括起来,例如“全球变暖”
  • 使用布尔运算符NOT,剔除不需要的条件。


  11如果你得到的结果太少:

  • 丢弃不太重要的概念,以便加宽主题内涵。
  • 使用更为一般化的词汇。
  • 对于单个的概念,使用替代性的项或者拼写,并用布尔逻辑运算符OR连接。
  • 在一些搜索引擎上,尝试寻找相似或者相关文档选项。 例如Google和ProFusion就提供该功能。


 



 

 

Copyright © 2003 SoWang.com.All Rights Reserved
中文搜索引擎指南网
 版权所有