首页>>搜索技巧>>正文

 

 繁体版搜索引擎的使用

 ncchenlin  2002/07/26




  注:本节供使用 Windows 简体中文版的读者参考

  许多内容很丰富的搜索引擎只有繁体中文版,特别是港台地区的搜索引擎。那么,对于电脑上安装了简体中文操作系统的用户来说,怎样使用这些繁体版的搜索引擎呢?

  (一)安装支持繁体中文的软件
  在简体中文环境下使用繁体搜索引擎,需要安装一套支持繁体中文的软件。如果你的浏览器是微软公司的探险者(Internet Explorer,即 IE,又译“探索者”)4.0 简体中文版,它本身就带有繁体中文支持,只是需要在安装的选项中选择这一项。
  支持繁体中文的软件,有的只有显示功能(只有 Big5 繁体字库),而没有输入功能(没有繁体 Big5 输入法)。如果仅仅想阅读搜索引擎的分类目录,那么只要能显示繁体字就可以了。而要使用关键词搜索,就必须有输入繁体字的功能。此外,有些软件可以在 Windows 3.1 环境下使用,有些软件只能在 Windows 95 下使用。因此必须根据自己的情况选择繁体中文软件。下边是一些常用软件的网址和功能说明:

软件名 Windows 3.1 Windows 95 输入功能 下载界面
微软繁体字 × √ √ 中文
南极星 √ √ √ 英、繁
两岸通 √ √ × 中文
四通利方 √ √ √ 中文
双桥 √ √ √ 英文
Unionway √ √ √ 英文

  使用苹果机(MAC)者可试一试 Elixir 或者 Chinese Language Kit 。

  (二)繁体字搜索
  在繁体版搜索引擎中使用搜索功能时,不同的浏览器会有不同的方法。

  1. IE 4.0 简体中文版以外的浏览器:
  如果你使用 IE 4.0 简体中文版(包括4.01 5.0等更高的版本)以外的其他任何一种浏览器,如 IE 3.2 中文版、IE 4.0 英文版、网景公司的导航者(Netsgape Navigator,又译“领航者”)等,那么问题很简单,只要启动支持繁体输入的中文软件,选择繁体字输入法(BIG5码的输入法),在搜索引擎的文字框中输入关键词的繁体字,就可以查询搜索了。
  例如:使用南极星的全球通时,将当前的环境设置为“中文自动繁体”,打开其中文输入法即可(参见 GBK 输入法)。

  2. IE 4.0 简体中文版:
  如果你使用 IE 4.0 简体中文版(包括4.01、5.0等更高的版本),问题就有些复杂了。IE 4.0 简体中文版在查阅繁体网站时,有时会需要手工指定语言版本(使用“查看”菜单的“字体”命令,或使用右键点击页面,选择“语言”项)。它内部有一个简、繁体自动转换的功能,由于很不完善,所以会引起许多问题。
  这时我们不能使用繁体 BIG5 码的输入法,而需要使用 GBK 码汉字输入法,输入 GBK 码中的繁体字后,IE 会自动将 GBK 码繁体转换为 Big5 码繁体,发送出去。
  关于 GBK 码,详见《繁体版搜索引擎的使用(二)—— GBK 码汉字及输入法》。
  当然,在个别情况下,即,要查询的关键词,简体与繁体完全相同,如“故事”二字,简体繁体写法完全相同,我们也可以使用一般的简体中文输入法,直接输入简体字(GB码),点击查询按钮后,IE 会自动将简体(GB 码)转换为繁体(Big5 码)发送出去。

  (三)注意事项
  在使用繁体搜索引擎时,要特别注意,由于大陆与台湾、香港的文化背景不同,因此形成的一些词汇方面的差异。例如:

大陆词汇 录像   知识产权 磁盘   新西兰  克林顿  硅谷  
台港词汇 录影   智慧财产权 磁碟   纽西兰  柯林顿  矽谷  

  所以,使用繁体搜索引擎,不但要输入繁体字,而且要注意台港词汇。
  优秀的搜索引擎,应该有一个对应词表,自动帮助用户转换词汇,但目前的搜索引擎,大都未达到这一水平。本站以后会陆续提供一些相关的参考资料。

繁体版搜索引擎的使用(二)
     —— GBK 码汉字及输入法

! 本页使用了 GBK 代码,有些字在一般的中文环境中无法显示,或出现乱码。使用 Windows 95 英文版 + 外挂中文平台者,请将当前环境设置为 GBK 中文,并关闭汉字自动识别功能。详情参见 GBK 代码表 的说明。

  使用 Windows 95 简体中文版的用户,也常用 IE 4.0 简体中文版浏览器,如前所述,用它来查询繁体搜索引擎,必须使用 GBK 码繁体汉字输入关键词,它自动将 GBK 繁体字转换为 BIG5 繁体汉字发送出去。下边我们介绍一些必要的知识。

  (一)什么是 GBK 汉字
  GBK 码汉字是一个大的汉字系统,它包括了目前流行的 GB 码简体汉字和 BIG5 繁体汉字。一般来说,GBK 码中的汉字分为两种情况,一是简体字,即原来 GB 码中的汉字,通常称为 GBK 简体;二是繁体字,即原来 BIG5 码中的汉字,通常称为 GBK 繁体。如“灯”是 GBK 简体,“燈”是 GBK 繁体。
  关于 GBK 更进一步的了解,请参看《参考资料》单元的 GBK 汉字内码扩展规范。
  Windows 95、98 简体中文版都使用了 GBK 汉字系统(其宋体、黑体两种字体为 GBK 字库)。此外像南极星、四通利方等外挂式中文平台,都提供了 GBK 汉字支持。

  (二)怎样输入 GBK 繁体字
  输入 GBK 繁体字有多种方法,各有优劣,这里介绍常见的几种:

  1. Windows 95、98 简体中文版自带的 GBK 汉字输入法
  Windows 95 提供了 GBK 内码、GBK 全拼、GBK 双拼、GBK 表形码和 GBK 郑码5种 GBK 输入法。但这些输入法不是安装的默认选项,需要从“控置面板”中打开“输入法”对话框来添加。Windows 98 默认安装的全拼输入法则可以选择输入一般汉字和 GBK 汉字(使用该输入法的属性设置)。
  这些 GBK 输入法中只有全拼比较常用,而且,这些输入法所输入的汉字,包括了 GBK 繁体和 GBK 简体,数量非常大,所以造成两方面的不便:一是重码率高,选字非常麻烦;二是繁体简体同时出现,有些字不容易分辨繁简。

  2. 微软拼音输入法 2.0 版
  这是一个免费软件,我们可以从微软公司的下列网址得到:
  http://www.microsoft.com/china/msdownload/mspy/default.htm
  (一些共享软件下载的网站也有提供)。
  微软拼音输入法 2.0 版中,有一个输入简体字和输入繁体字的选择,当选择繁体字输入时,输入的便是 GBK 繁体字。由于选择繁体输入后,它只列出 GBK 繁体,所以重码率较 GBK 全拼低得多。但是这一输入法体积非常庞大,有6.87 MB,同时,它不能在网景公司的导航者(Netscape Navigator)中使用。

  3. 微软公司的 Global IME for Chinese (Tradition)
  这也是一个免费软件,可以从微软公司的下列网址得到:
  http://www.microsoft.com/ie_intl/cn/ie40/?/ie_intl/cn/ie40/ime.htm
  Global IME 中包括了一个可以在简体中文版 IE 中输入繁体字的输入法,但这是一个通行于台湾地区的“注音输入法”,它与通行于大陆的“拼音输入法”有相通之处,但记音符号、拼写规定和键盘规定方面又有很大差异,所以并不实用。而且,它同样不能用于其他的浏览器。

  4. 南极星公司的南极星全球通(Njstar Communicator 2.0)所带的输入法
  南极星全球通是一个中文环境,可以在任何语言版本的 Windows 95、98 中使用,它所带的输入法有拼音、双拼、注音、五笔画、四角号码等许多种。启动南极星后需要做四步工作:
  ① 击当前环境设置按钮,选择 Chinese Auto Tradition(中文自动繁体);
  ② 击输入法按钮,选择 Chinese Input(中文输入法);
  ③ 击输出代码按钮,选择“中文扩展码 GBK”,或“统一码 Unicode”;如果你使用的浏览器是导航者(Netscape Navigator),则需要在此选择“中文大五码 BIG5”;
  ④ 击输入法按钮,选择你所熟悉的输入法,便可以输入GBK繁体中文字了。
  如下图所示:

  南极星是一个非常优秀的中文软件,它不仅可以在 IE 中使用,也可以在导航者(Netscape Navigator)或其他软件中使用。但它不是一个免费软件,你可以在南极星的网站中,下载到免费使用30天的试用版。

  (三)注意事项
  GBK 码汉字虽然可以分为繁体和简体,但对于以简体字为基本环境的用户来说,还有许多复杂的问题,需要有更多的繁体字知识,才能更好地掌握。繁体与简体的对应关系,主要有三种情况:
  1. 繁体与简体一一对应。如繁体字“燈”,只对应一个简体字“灯”。
  2. 多个繁体字对应一个简体字。如繁体的“复”、“復”、“複”,对应简体的一个“复”字。
  3. 繁体、简体相同。如“故事”二字。
  在上述第二种情况时,需要使用不同的繁体字。如简体字“发”,对应“發”、“髮”、“髪”三个 GBK 繁体字。在“发展”一义时,用“發展”,在“头发”一义时用“頭髮”,而“髪”是异体字,BIG5 繁体中没有,一般也不用。再如“复”字,在“复杂”一义时用“複雜”,在“反复”一义时用“反復”。
  有些简体字,虽然对应两个繁体字,但有时可以通用。如简体的“汇”,对应繁体的“匯”、“彙”和“彚”,在“词汇”的意义上,繁体可以用“詞匯”,也可以用“詞彙”。
  类似一个对应多个的简体字,有300多个。
  此外,有些字简体、繁体差异很小,如“故宫”的“宫”,繁体字为“宮”,两个口之间还有一撇。在使用 Windows 95 自带的 GBK 汉字输入法时,需要特别注意。

  好的搜索引擎,应该有这样一个对应字表,自动帮助用户转换。但目前的搜索引擎,多数未达到如此完善的地步。本站以后会陆续提供一些相关的参考资料。



   发表观点>>  


Copyright ©  2001-2002 SOWANG.COM All rights reserved. 
中文搜索引擎指南网  版权所有