论文部分内容阅读
[摘 要] 本文从中文名称音译入手,介绍Scirus科学搜索引擎的学科范围、内容、检索模式和检索结果的显示方式,探讨Scirus所具有的提供专门科学信息、精炼检索模式、显示检索结果等方面的择优特色。
[关键词] Scirus(择优);科学搜索引擎;精炼检索
Scirus是目前互联网上最全面、综合性最强的科技文献门户网站之一,也是一个免费为科学家、研究人员和学生开发的网络检索引擎。它通过科学性内容的网页、期刊和数据库,择优提供科学信息,为科学家们快速查找所需的信息打开了一道便捷之门。它在提供专门科学信息、精炼检索模式、显示检索结果等方面都很有特色。
1 关于Scirus
把择优作为“Scirus科学搜索引擎”的中文译名,不仅取其谐音,而且也符合为搜索引擎取名的原意。2001年4月,荷兰Elsevier Sei-enee公司与FastSearch&Transfer合作开发了科技专业搜索引擎,取名为Scirus。作为搜索引擎的名字,Scirus的本义是能预见未来的人,而此搜索引擎面向的正是科学家、研究人员和学生,那些对科学不断探索、不断创新,并能预测未来发展的人。因此,科技专业搜索引擎的服务对象是择优的,它所包含的内容和提供的检索也是择优的,能够帮助使用者从复杂广博的信息中择优选用所需的资料。从技术上讲,Scirus择优采用了其他搜索引擎的最新技术,以自身拥有的资源为主体,与拥有科学资源的网站建立合作关系,对网上具有科学价值的资源进行整合,以适应用户科学专业信息的搜索需求。它凭借择优搜索的表现,连续3年被《SearchEngine Watch》评为“最佳专业搜索引擎”。
2 学科范围和检索模式
Scirus覆盖的学科范围包括工程、工业技术,农业、生物学,经济、社会学等,天文学、地理学,化学、数学、物理学,医学等20多门学科。Scirus所覆盖的内容十分丰富,有与科学有关的网页、MEDLINE文摘、ScienceDirect全文、美国专利以及NASA技术报告和来源于Cog-Prints的电子文献、来自Mathemat-ics Preprint Server的预印本、源于BioMed Central的全文等。
Seirus检索功能十分强大,提供了基本检索、精炼检索与高级检索3种模式。基本检索(BasicSearch):基本检索功能与其他搜索引擎一样,支持限定检索,指定检索精确的短语或选择所有期刊资源或选择所有网络资源等,也可选择这3种方式的任意组合。精炼检索(Refine Search):用户能够通过从一个相关分类词表中进行选择来精炼其搜索。高级检索(Advanced Search):高级检索界面简洁、方便,允许用户进行个性化检索。可以指定检索结果信息类型,如期刊论文、科学家主页、预印本、会议、文摘等或者全部选定;可以指定检索的主题领域,从医学、工程、法律到社会行为科学等20个领域中选择一个或几个,也可全部选定;可以限定检索细节,如选择文献出版、发行年,选择需要的文件格式,或定位在文献全文中,或定位在文章标题、期刊名、作者名、ISDN等数据上,并可指定是包含全部检索词还是部分检索词或是不包含检索词。通过用户的指定和限制,Scirus实现了个性化服务。
Scirus在显示检索结果时,设定了两种排序方式,一是系统默认的按相关度顺序排序:二是按文献时间顺序排序。无论是相关度方式,还是文献时间方式,都详尽地显示出文献题目、作者、刊名、文摘,并标明信息来源以及相关文献。
3 择优(Scirus)的特色
3.1 提供专门科学信息
与其他搜索引擎不同的是,Scirus择优提供涵盖专门科学方面的信息。首先,由于择优是通过最先进的搜索引擎技术驱动,对网络中所搜索到的结果进行过滤,因此只提供包含有科学信息的成分。其次,择优收录被一般搜索引擎所忽略掉的同行专家评审文献,以保证能查找到更多的同行专家评议过的相关方面的期刊论文。再次,通常进入网站两层以上链接,择优提供相关信息,诸如全球最大的科学、技术以及医学数据库,学科相关的图表、报告、论文及专利资料。因此,在搜索的结果中所提供的都是与科学有关的信息。例如,用google检索“snows”,结果显示大部分是商业公司,把“snows”当作了人名,显然与科学的关系不是十分密切。而用scirus检索“snows”,结果显示大部分是与雪或下雪相关的文章,提供的是专门科学方面的信息,对于科学研究有极大的帮助。
3.2 精炼检索模式
Scirus检索模式除了具有与其他搜索引擎相同的基本检索和高级检索外,还设计了精炼检索模式,主要通过检索字段的选择、特定资源的选择、学科内容的选择、在线检索词选择以及检索结果的排序选择来实现。在标引的过程中,Scirus将分类词添加到文献中,在此基础上就有了“精炼你的搜索”功能,用户每次进行搜索后,系统会自动地从信息中抽取反映主题内容的关键词,以列表的形式显示在界面。用户只需要点击某个词,就可以把该词添加到检索提高式中,限定前一次检索范围。从而满足了用户检索的个性化需求,有利于提高搜索的专指性。这是一般的搜索引擎所无法比拟的。
3.3 显示检索结果
Scirus是一个专业的科学搜索引擎,通过独特的倒置金字塔结构来准确锁定科学信息,保证了检索结果的专业性和查准率。由于搜索结果排序技术的增强,搜索结果择优显示相关度较高的检索词或网页。因此,Scirus可以根据用户的真实需要择优显示检索结果。
(1)显示相关度较高
Scirus择优显示相关度较高的结果,一是决定于排序技术:排序是由词频和链接两个基本的值来决定的。静态排序是对词频进行排序,而动态排序则是主要针对链接的排序,一个网页被其他网页参考或链接得越频繁,就被排得越靠前,把静态排序和动态排序结合起来,相关度就会明显上升。二是决定于对相关性判断的依据:检索词在结果中出现的位置和频率占一半权重,该网页链接数占了权重的另一半,由此来决定检索结果的相关性。Scirus有效地将两者结合起来,将用户的提问与文献内容、网页的链接等因素结合起来考虑,使排序能够更加合理地反映检索结果,所以显示结果是最优的。
(2)标记功能
Scirus的标记功能是对检索结果选取所需文献进行标记。经标记的记录可显示,也可为读者保存选定的检索结果,还可用E-mail形式发送,为读者再次利用检索结果提供方便。
[关键词] Scirus(择优);科学搜索引擎;精炼检索
Scirus是目前互联网上最全面、综合性最强的科技文献门户网站之一,也是一个免费为科学家、研究人员和学生开发的网络检索引擎。它通过科学性内容的网页、期刊和数据库,择优提供科学信息,为科学家们快速查找所需的信息打开了一道便捷之门。它在提供专门科学信息、精炼检索模式、显示检索结果等方面都很有特色。
1 关于Scirus
把择优作为“Scirus科学搜索引擎”的中文译名,不仅取其谐音,而且也符合为搜索引擎取名的原意。2001年4月,荷兰Elsevier Sei-enee公司与FastSearch&Transfer合作开发了科技专业搜索引擎,取名为Scirus。作为搜索引擎的名字,Scirus的本义是能预见未来的人,而此搜索引擎面向的正是科学家、研究人员和学生,那些对科学不断探索、不断创新,并能预测未来发展的人。因此,科技专业搜索引擎的服务对象是择优的,它所包含的内容和提供的检索也是择优的,能够帮助使用者从复杂广博的信息中择优选用所需的资料。从技术上讲,Scirus择优采用了其他搜索引擎的最新技术,以自身拥有的资源为主体,与拥有科学资源的网站建立合作关系,对网上具有科学价值的资源进行整合,以适应用户科学专业信息的搜索需求。它凭借择优搜索的表现,连续3年被《SearchEngine Watch》评为“最佳专业搜索引擎”。
2 学科范围和检索模式
Scirus覆盖的学科范围包括工程、工业技术,农业、生物学,经济、社会学等,天文学、地理学,化学、数学、物理学,医学等20多门学科。Scirus所覆盖的内容十分丰富,有与科学有关的网页、MEDLINE文摘、ScienceDirect全文、美国专利以及NASA技术报告和来源于Cog-Prints的电子文献、来自Mathemat-ics Preprint Server的预印本、源于BioMed Central的全文等。
Seirus检索功能十分强大,提供了基本检索、精炼检索与高级检索3种模式。基本检索(BasicSearch):基本检索功能与其他搜索引擎一样,支持限定检索,指定检索精确的短语或选择所有期刊资源或选择所有网络资源等,也可选择这3种方式的任意组合。精炼检索(Refine Search):用户能够通过从一个相关分类词表中进行选择来精炼其搜索。高级检索(Advanced Search):高级检索界面简洁、方便,允许用户进行个性化检索。可以指定检索结果信息类型,如期刊论文、科学家主页、预印本、会议、文摘等或者全部选定;可以指定检索的主题领域,从医学、工程、法律到社会行为科学等20个领域中选择一个或几个,也可全部选定;可以限定检索细节,如选择文献出版、发行年,选择需要的文件格式,或定位在文献全文中,或定位在文章标题、期刊名、作者名、ISDN等数据上,并可指定是包含全部检索词还是部分检索词或是不包含检索词。通过用户的指定和限制,Scirus实现了个性化服务。
Scirus在显示检索结果时,设定了两种排序方式,一是系统默认的按相关度顺序排序:二是按文献时间顺序排序。无论是相关度方式,还是文献时间方式,都详尽地显示出文献题目、作者、刊名、文摘,并标明信息来源以及相关文献。
3 择优(Scirus)的特色
3.1 提供专门科学信息
与其他搜索引擎不同的是,Scirus择优提供涵盖专门科学方面的信息。首先,由于择优是通过最先进的搜索引擎技术驱动,对网络中所搜索到的结果进行过滤,因此只提供包含有科学信息的成分。其次,择优收录被一般搜索引擎所忽略掉的同行专家评审文献,以保证能查找到更多的同行专家评议过的相关方面的期刊论文。再次,通常进入网站两层以上链接,择优提供相关信息,诸如全球最大的科学、技术以及医学数据库,学科相关的图表、报告、论文及专利资料。因此,在搜索的结果中所提供的都是与科学有关的信息。例如,用google检索“snows”,结果显示大部分是商业公司,把“snows”当作了人名,显然与科学的关系不是十分密切。而用scirus检索“snows”,结果显示大部分是与雪或下雪相关的文章,提供的是专门科学方面的信息,对于科学研究有极大的帮助。
3.2 精炼检索模式
Scirus检索模式除了具有与其他搜索引擎相同的基本检索和高级检索外,还设计了精炼检索模式,主要通过检索字段的选择、特定资源的选择、学科内容的选择、在线检索词选择以及检索结果的排序选择来实现。在标引的过程中,Scirus将分类词添加到文献中,在此基础上就有了“精炼你的搜索”功能,用户每次进行搜索后,系统会自动地从信息中抽取反映主题内容的关键词,以列表的形式显示在界面。用户只需要点击某个词,就可以把该词添加到检索提高式中,限定前一次检索范围。从而满足了用户检索的个性化需求,有利于提高搜索的专指性。这是一般的搜索引擎所无法比拟的。
3.3 显示检索结果
Scirus是一个专业的科学搜索引擎,通过独特的倒置金字塔结构来准确锁定科学信息,保证了检索结果的专业性和查准率。由于搜索结果排序技术的增强,搜索结果择优显示相关度较高的检索词或网页。因此,Scirus可以根据用户的真实需要择优显示检索结果。
(1)显示相关度较高
Scirus择优显示相关度较高的结果,一是决定于排序技术:排序是由词频和链接两个基本的值来决定的。静态排序是对词频进行排序,而动态排序则是主要针对链接的排序,一个网页被其他网页参考或链接得越频繁,就被排得越靠前,把静态排序和动态排序结合起来,相关度就会明显上升。二是决定于对相关性判断的依据:检索词在结果中出现的位置和频率占一半权重,该网页链接数占了权重的另一半,由此来决定检索结果的相关性。Scirus有效地将两者结合起来,将用户的提问与文献内容、网页的链接等因素结合起来考虑,使排序能够更加合理地反映检索结果,所以显示结果是最优的。
(2)标记功能
Scirus的标记功能是对检索结果选取所需文献进行标记。经标记的记录可显示,也可为读者保存选定的检索结果,还可用E-mail形式发送,为读者再次利用检索结果提供方便。