论文部分内容阅读
1998年9月斯坦福大学两位博士生Larry Page与Sergey Brin设计了Google(www.google.com)搜索引擎,1999年Google Inc.创立。迄今,Google已经获得30多项业界大奖。Google的成功得益于其强大的功能和独到的特点,目前,各大引擎竞相模仿Google的功能和特色,如网页快照,偏好设置等。Google成为众多搜索引擎的领头羊。Google非中国本土公司,但它支持中文搜索,其中文搜索引擎是收集亚洲网站最多的搜索引擎之一,国内使用其独立搜索引擎的人数正迅猛增长。
1.关键词的选择
Google的关键词检索,所使用的关键词可以是字、单词,也可以是短语、词组或句子。使用Google进行检索非常简单,只要在搜索框内输入一个关键字,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。单个关键字搜索得到的信息量巨大,会带出海量的不相关信息,通常检索多是使用词语作为关键词。
复杂课题检索,主题分析后就要进行正确选词。使用Google,不同关键词的选择,将决定检索结果排列不同,而且选词不准,无法发挥Google强大的检索功能,影响检索效率。
如果检索专业或学术性信息,尤其是科技信息,建议在选择关键词时应注意以下几点:
(1)选择专指性强的词
关键词专指性强弱是影响查准率的重要因素之一,选用专指性强的关键词,则检出的网站针对性较强,查准率较高。专指性强弱是对选词表达主题的深度而言,要深入分析检索主题,选择研究的对象及其重要参数、概念等名词术语;选择所应用的对文章起关链作用的基础理论、方法、设备等名称;选择反映重要研究成果的词。例如,查找“网络检索工具的历史”有关的信息,选词时选用“搜索引擎”一词,比选用“检索工具”一词,查准率会更高。
(2)多角度选词
关键词的确定必须经过对检索主题正确分析得到。复杂主题的关键词,要将反映该主题的各个主要方面的词汇都提炼出来,以提高文献的查全率。例如,查找“搜索引擎发展的历史”,因为搜索引擎的历史,是与互联网早期的文件检索工具“Archie”相关的。此外,搜索引擎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,“Yahoo”是优秀搜索引擎的代表。因此,除了选择“搜索引擎”、“历史”外,还要选择“Archie”、“蜘蛛”、“Lycos”、“Yahoo”等词。这些词都是起关键作用的检索词。
(3)选择限制主题的词
在关键词确定之后,运用检索技术并不能保证检索出来的信息都满意,有时查询的结果太多太泛。由于Google只搜索包含关键词的网页,除了增加表达主题的关键词,还可增加限制性的词语作为关键词,以排除多余的信息。例如:输入“红旗-汽车”,将会找到关于红旗但不含“汽车”的网页。
2.检索式的构建及检索实例
为了完整准确地表达检索需求,提高检索的精确度,正确选择关键词后,还需要了解和运用Google各种检索语法与技巧,根据Google提供的操作、运算符和使用规则说明,设计出一个高质量的检索式。
(1)逻辑检索
Google用空格表示逻辑“与”操作,用减号“-”表示逻辑“非”操作。“A-B”表示搜索包含A但不包含B的网页。Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。
(2)通配符检索
很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。为提供最准确的资料,Google不使用“词干法”,也不支持“通配符”(*)搜索。也就是说,Google只搜索与输入的关键词完全一样的字词。例如:搜索“googl”或“googl*”,不会得到类似“googler”或“googlin”的结果。
(3)短语或者句子检索
Google的关键词可以是单词,也可以是短语。用短语做关键字,必须加用英文双引号,否则空格会被当作“与”操作符。双引号中的词语(比如“自然与文化遗产”)在查询到的文档中将作为一个整体出现。这一方法在查找名言警句或专有名词时显得格外有用。
(4)搜索引擎忽略的字符以及强制搜索
Google对无实义的词或一些网路上出现频率极高的英文单词,如“i”、“com”、“www”、“的”等,以及一些符号如“*”、“.”等,作忽略处理。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。另一个强制搜索的方法是把上述的关键字用英文双引号引起来。例如,检索“internet上www的历史”,检索式为:+www+的历史internet。又如,“www的历史”中,“的”其实是忽略词,但因为被用英文双引号引起来,搜索引擎就强制搜索这一特定短语。注意:大部分常用英文符号(如问号、句号、逗号等)无法成为搜索关键字,强制也不行。
(5)实例——查找有关“搜索引擎的历史”的信息
对此课题检索,搜索有关搜索引擎的中文(简体)网页,上网时间为2002年11月18日1025。
[检索式1]搜索引擎
[结果1分析]已搜索有关搜索引擎的中文(简体)网页。共约有77.9万项查询结果。前十项,绝大部分链接是搜索引擎本身,而不是对搜索引擎的或者搜索技巧方面的介绍。
[检索式2]搜索引擎历史
[结果2分析]共约有8.32万项查询结果。用了两个关键字,查询结果已经从77多万项减少到8万多项。但查看一下搜索结果,发现绝大部分结果还是不符合要求,大部分网页涉及的“历史”,并不是我们所需要的“搜索引擎的历史”。必须要删除与搜索引擎不相关的“历史”。研究结果发现,这部分无用的信息,总是和“文化”这个词相关的,另外一些常见词是“中国历史”、“世界历史”、“历史书籍”等。
[检索式3]搜索引擎历史-文化-中国历史-世界历史
[结果3分析]通过去掉不相关信息,搜索结果又减少为3.8万项。第一个搜索结果(搜索引擎直通车≡搜索引擎发展历史),非常符合搜索要求。第三项搜索结果(463搜索王 --首页 >>
Internet搜索手册 >>搜索引擎的历史……),也符合搜索要求。但10个结果只有两个符合要求,检准率太低。为了建立更佳的检索式,须对课题深入了解。先点开第一个结果看看,点开se-express.com的这个名为“搜索引擎发展历史”的网页,发现搜索引擎的历史,是与互联网早期的文件检索工具“Archie”息息相关。此外,搜索引擎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,使搜索引擎深入人心的是“Yahoo”。了解了这些信息,就可以进一步建立更完美的检索式,让搜索结果符合要求。
[检索式4]搜索引擎历史archie OR蜘蛛OR lycos OR yahoo-文化-中国历史
(“世界历史”被忽略,因为Google的查询限制在10个字词之内)
[结果4分析]共约有8050项查询结果。搜索结果缩小到8千多项,前20项结果中,大部分都符合搜索要求。
(6)检索式的实现
检索式的实现可以在搜索框内一次输入,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。也可以一次添加一个词语在“在此搜寻结果的范围内查询”。还可以不用操作符和运算符,在高级搜索查询网页中,按提示在搜索框内输入关键词的实现,如以上检索式4可分解写为“可包含以下全部的字词:历史;包含以下的完整字句:搜索引擎;包含以下任何一个字词:archie蜘蛛lycos yahoo;不包括以下字词:文化中国历史”。
用操作符和运算符时,须注意操作符与作用的关键字之间有否空格。比如“-”的使用,“搜索引擎 -文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。“与”操作必须用大写的“OR”,留有空格且不是小写的“or”。双引号用英文引号等。▲
参考文献
1 .Google大全.http://www.google.com.
2. 刘艳.谈搜索引擎Google.图书馆学刊,2002(3)
3 Donquix.如何使用Google搜索引擎.家庭电脑世界,2001(7)
(作者单位:华南理工大学图书馆广东广州510640)
1.关键词的选择
Google的关键词检索,所使用的关键词可以是字、单词,也可以是短语、词组或句子。使用Google进行检索非常简单,只要在搜索框内输入一个关键字,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。单个关键字搜索得到的信息量巨大,会带出海量的不相关信息,通常检索多是使用词语作为关键词。
复杂课题检索,主题分析后就要进行正确选词。使用Google,不同关键词的选择,将决定检索结果排列不同,而且选词不准,无法发挥Google强大的检索功能,影响检索效率。
如果检索专业或学术性信息,尤其是科技信息,建议在选择关键词时应注意以下几点:
(1)选择专指性强的词
关键词专指性强弱是影响查准率的重要因素之一,选用专指性强的关键词,则检出的网站针对性较强,查准率较高。专指性强弱是对选词表达主题的深度而言,要深入分析检索主题,选择研究的对象及其重要参数、概念等名词术语;选择所应用的对文章起关链作用的基础理论、方法、设备等名称;选择反映重要研究成果的词。例如,查找“网络检索工具的历史”有关的信息,选词时选用“搜索引擎”一词,比选用“检索工具”一词,查准率会更高。
(2)多角度选词
关键词的确定必须经过对检索主题正确分析得到。复杂主题的关键词,要将反映该主题的各个主要方面的词汇都提炼出来,以提高文献的查全率。例如,查找“搜索引擎发展的历史”,因为搜索引擎的历史,是与互联网早期的文件检索工具“Archie”相关的。此外,搜索引擎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,“Yahoo”是优秀搜索引擎的代表。因此,除了选择“搜索引擎”、“历史”外,还要选择“Archie”、“蜘蛛”、“Lycos”、“Yahoo”等词。这些词都是起关键作用的检索词。
(3)选择限制主题的词
在关键词确定之后,运用检索技术并不能保证检索出来的信息都满意,有时查询的结果太多太泛。由于Google只搜索包含关键词的网页,除了增加表达主题的关键词,还可增加限制性的词语作为关键词,以排除多余的信息。例如:输入“红旗-汽车”,将会找到关于红旗但不含“汽车”的网页。
2.检索式的构建及检索实例
为了完整准确地表达检索需求,提高检索的精确度,正确选择关键词后,还需要了解和运用Google各种检索语法与技巧,根据Google提供的操作、运算符和使用规则说明,设计出一个高质量的检索式。
(1)逻辑检索
Google用空格表示逻辑“与”操作,用减号“-”表示逻辑“非”操作。“A-B”表示搜索包含A但不包含B的网页。Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。
(2)通配符检索
很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。为提供最准确的资料,Google不使用“词干法”,也不支持“通配符”(*)搜索。也就是说,Google只搜索与输入的关键词完全一样的字词。例如:搜索“googl”或“googl*”,不会得到类似“googler”或“googlin”的结果。
(3)短语或者句子检索
Google的关键词可以是单词,也可以是短语。用短语做关键字,必须加用英文双引号,否则空格会被当作“与”操作符。双引号中的词语(比如“自然与文化遗产”)在查询到的文档中将作为一个整体出现。这一方法在查找名言警句或专有名词时显得格外有用。
(4)搜索引擎忽略的字符以及强制搜索
Google对无实义的词或一些网路上出现频率极高的英文单词,如“i”、“com”、“www”、“的”等,以及一些符号如“*”、“.”等,作忽略处理。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。另一个强制搜索的方法是把上述的关键字用英文双引号引起来。例如,检索“internet上www的历史”,检索式为:+www+的历史internet。又如,“www的历史”中,“的”其实是忽略词,但因为被用英文双引号引起来,搜索引擎就强制搜索这一特定短语。注意:大部分常用英文符号(如问号、句号、逗号等)无法成为搜索关键字,强制也不行。
(5)实例——查找有关“搜索引擎的历史”的信息
对此课题检索,搜索有关搜索引擎的中文(简体)网页,上网时间为2002年11月18日1025。
[检索式1]搜索引擎
[结果1分析]已搜索有关搜索引擎的中文(简体)网页。共约有77.9万项查询结果。前十项,绝大部分链接是搜索引擎本身,而不是对搜索引擎的或者搜索技巧方面的介绍。
[检索式2]搜索引擎历史
[结果2分析]共约有8.32万项查询结果。用了两个关键字,查询结果已经从77多万项减少到8万多项。但查看一下搜索结果,发现绝大部分结果还是不符合要求,大部分网页涉及的“历史”,并不是我们所需要的“搜索引擎的历史”。必须要删除与搜索引擎不相关的“历史”。研究结果发现,这部分无用的信息,总是和“文化”这个词相关的,另外一些常见词是“中国历史”、“世界历史”、“历史书籍”等。
[检索式3]搜索引擎历史-文化-中国历史-世界历史
[结果3分析]通过去掉不相关信息,搜索结果又减少为3.8万项。第一个搜索结果(搜索引擎直通车≡搜索引擎发展历史),非常符合搜索要求。第三项搜索结果(463搜索王 --首页 >>
Internet搜索手册 >>搜索引擎的历史……),也符合搜索要求。但10个结果只有两个符合要求,检准率太低。为了建立更佳的检索式,须对课题深入了解。先点开第一个结果看看,点开se-express.com的这个名为“搜索引擎发展历史”的网页,发现搜索引擎的历史,是与互联网早期的文件检索工具“Archie”息息相关。此外,搜索引擎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,使搜索引擎深入人心的是“Yahoo”。了解了这些信息,就可以进一步建立更完美的检索式,让搜索结果符合要求。
[检索式4]搜索引擎历史archie OR蜘蛛OR lycos OR yahoo-文化-中国历史
(“世界历史”被忽略,因为Google的查询限制在10个字词之内)
[结果4分析]共约有8050项查询结果。搜索结果缩小到8千多项,前20项结果中,大部分都符合搜索要求。
(6)检索式的实现
检索式的实现可以在搜索框内一次输入,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。也可以一次添加一个词语在“在此搜寻结果的范围内查询”。还可以不用操作符和运算符,在高级搜索查询网页中,按提示在搜索框内输入关键词的实现,如以上检索式4可分解写为“可包含以下全部的字词:历史;包含以下的完整字句:搜索引擎;包含以下任何一个字词:archie蜘蛛lycos yahoo;不包括以下字词:文化中国历史”。
用操作符和运算符时,须注意操作符与作用的关键字之间有否空格。比如“-”的使用,“搜索引擎 -文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。“与”操作必须用大写的“OR”,留有空格且不是小写的“or”。双引号用英文引号等。▲
参考文献
1 .Google大全.http://www.google.com.
2. 刘艳.谈搜索引擎Google.图书馆学刊,2002(3)
3 Donquix.如何使用Google搜索引擎.家庭电脑世界,2001(7)
(作者单位:华南理工大学图书馆广东广州510640)