论文部分内容阅读
[摘 要]NoteExpress是一款文献管理的软件平台,具备文献采集、管理及应用等功能。本文通过将三大检索数据库的检索结果导入NoteExpress,建立一个新的信息管理系统,通过使用表明该信息管理系统可成为评估高校科研水平、掌握最新科研动态、提高情报服务效率的有效辅助工具。
[关键词]NoteExpress;SCI;EI;ISTP;信息管理系统
[中图分类号]G354 [文献标识码]A [文章编号]1008-0821(2010)05-0140-04
NoteExpress-based Information Management System of Three Major RetrievalLi Mao Xu Ziyuan
(Library,Yanshan University,Qinhuangdao 066004,China)
[Abstract]The NoteExpress is a document management software platform with the functions of documents retrieval,management and application.This paper aimed to establish a new information management system through importing retrieval results from the three important databases of SCI,EI and ISTP.Through the application of that the new system will be an excellent assistant tool for the evaluating university scientific research level,mastering the newest research development and increasing the efficiency of information service.
[Keywords]NoteExpress;SCI;EI;ISTP;information management system
《科学引文索引》(SCI)、《工程索引》(EI)、《国际会议录索引》(ISTP)为世界著名的三大科技文献检索系统,是国际公认的进行科学统计与科学评价的主要检索工具,其中以SCI最为重要。这三大检索系统在衡量一个国家,一个科研机构,一所大学的科研实力以及评估科研工作的社会效果等方面,发挥着重要的作用[1],也因此得到了从国家、学校到科研人员的高度重视。
随着高校对三大检索系统的利用率及查询数据的需求量逐年升高,有必要建立一款信息管理系统为评估高校专业科研水平、掌握最新科研动态以及情报服务人员开展工作提供辅助工具。笔者在对NoteExpress(以下简称NE)文献管理软件的使用中发现,因其在采集、管理、分析文献等方面均具有较完备及多种独特功能,以其为软件平台构建三大检索信息管理系统,能够方便有效的对超量信息进行统计处理,应该得到推广和广泛使用。鉴于此,笔者就如何利用三大检索查询结果与NE软件相关技术搭建信息管理系统作简要介绍。
1 查询结果导出
三大检索系统均包括印刷版、光盘版及网络版等3种出版形式[2],且因查询结果导出方法基本相同,所以笔者以更新周期短(每周1次),利用率高的SCI网络版(SCI Expanded)为例进行研究。
首先进入SCI Expanded网址http:∥isiknowledge.com/(只有订购用户有权使用),选择“Web of Science”检索平台,如图1所示,在搜索框中键入“yanshan univ*”(以燕山大学为例),检索范围选择“地址”,如需限制年限,可以在“入库时间”中选择所需年限范围,然后点击“检索”按钮进行检索。这里需要注意的是,因ISTP现已集成到Web of Science检索平台中,所以在“引文数据库”列出的5个选择范围中,要取消对ISTP数据库的选择,以免造成数据混淆。图1 SCI检索平台
在检索结果中,会列出符合检索条件的所有文献信息列表,其下方的“输出记录”一栏可以方便用户按步骤导出所需的相关文献信息记录,如图2所示。第一步就检索结果进行有针对性的选择或批量选择,SCI检索平台要求批量选择一次最多可以导出500条记录(EI为400条);第二步为选择记录输出字段,为了追求信息的全面性,这里选择“全纪录”并勾选“包含引用的参考文献”;第三步就所选记录进行本地保存,因为笔者是利用NE管理软件进行管理,所以在下拉菜单中选择“保存到其他参考文献软件”并点击“保存”即可完成查询结果的导出。图2 检索结果输出记录
2010年5月第30卷第5期基于NoteExpress的三大检索信息管理系统May,22 获取题录信息
在NE安装完毕后第一次运行时,系统会自动加载“示例库(sample)”[3]。为了建立三大检索信息系统,规范相关文献信息,用户可以通过NE界面上方主菜单【文件】的【新建数据库】新建一个命名为三大检索的数据库。在左侧目录树的题录文件夹下,可以建立3个名称分别为SCI、EI、ISTP的文件夹,以便存储各系统题录信息。NE提供了强大的题录导入功能,其导入文献资料的速度比国外同类软件快10倍以上[4],且由于各大数据库提供商导出的文献信息格式不尽相同,所以NE设计了包括三大检索系统文献信息格式在内的181个国内外数据库过滤器,用户可以根据自身需求新建、修改、删除相应的过滤器,并将题录信息经过“过滤”后置入NE中。
SCI导出的题录全纪录信息中包括AU(作者)、AF(作者全称)、TI(题目)等在内的32个英文标识,而NE自带SCI过滤器有效标识仅有22个,且其中某些英文标识与中文字段相对不符,为了更加全面及准确的显示题录信息,在导入题录信息前,需要对过滤器进行字段及标识的添加或修改。
点击NE主菜单【工具】→【选项】→【自定义】,选择“字段自定义”会弹出自定义字段对话框,选择相应的题录类型后,即可对相应类型字段进行操作。系统提供了添加字段、添加分组、移除、重命名、上移和下移等6个功能,用户可以根据需求进行操作。如SCI中另有ISI文献传递号,可以利用添加字段功能予以添加。自定义字段中的字段显示顺序即为NE主界面右下方题录相关信息中“细节”的字段预览顺序,为了使导入的三大检索系统基本信息实现统一化预览,可以利用删除、上移或下移等功能对主要字段区域进行合理化设置,方便用户快速预览和查找相关字段信息。
对字段进行相关操作后,便可以到过滤器编辑器中对相应字段与英文标识进行针对性的关联。点击NE主菜单【工具】→【过滤器】→【过滤器编辑器】,在弹出的对话框中查找并双击标题为“Web of Science”项,此时便打开了“Web of Science”过滤器编辑器,在“字段”栏目中,显示了当前过滤器字段与标识的关联情况,用户可以根据需要双击某条字段后查看或者更改关联情况,以确保导入的题录信息相对于NE显示的字段准确无误。为了尽量统一三大检索导入题录信息中作者名称的写法,“Web of Science”过滤器中的“作者”字段要更改为与“AF”(作者全称)进行关联,方便用户对信息更有效的管理和分析。
上述工作完毕后,用户便可以利用NE自带的导入题录功能将三大检索输出记录快速的导入到NE题录指定的文件夹下,初步的完成了三大检索信息管理系统的建立。
3 管理题录信息
NE参考文献管理软件具有比较全面的文献管理功能,不仅包含如添加、删除、编辑、排序等一般性管理[5],也包括自动分组、统计分析、形成统计图表等智能化管理,并且随着技术的发展和软件的成熟,管理功能将得到进一步加强和完善。
31 统一格式
由于三大检索系统录入题录信息格式各不相同,如作者有全程、简称、大小写之分,以wang guoqiang为例,SCI基本录入格式为wang gq,EI主要录入格式则有wang guoqiang、guoqiang wang、wang gq、gq wang等6种,为了实现三大检索题录信息统一化管理,且方便用户统计分析,需要将作者名称进行统一更改为wang guoqiang形式。点击NE主菜单【工具】→【批量替换】,利用批量替换功能将作者字段中的空格和“-”替换成缩进,“,”替换成空格,并且全部更改为小写字母,易于组织和统一检索。其他如wang gq等简写方式,需要用户与该作者确定后利用手动录入功能进行修改。
32 组织功能
NE独有的组织功能提供了作者、关键词及作者机构的枚举视图,排序方式均以英文首字母从A~Z排序,“作者”子节点将数据库中所有作者名称一一列出,方便科研人员及时掌握自身发表文章情况及跟踪某课题领域其他主要科研人员发表文章现状;“关键词”子节点列出了所有导入文献的关键词,有助于科研人员准确、有针对性的查找涉及某一关键词的相关文献信息并进行数据统计分析;“作者机构”子节点枚举了所有文献作者机构名称,该功能方便科研人员了解某一机构发表文章情况,及掌握某高校各个研究机构发表文章现状以用于评估专业科研水平。
33 站内检索
由于三大检索题录信息数量多,无法通过手动方式快速准确的寻找某条或某类记录,用户可以通过NE的快速检索或本地高级检索功能进行查找。在默认情况下,NE会保留最近5次(次数可更改)的检索历史,并可直接在数据库的树形结构“检索→最近检索”文件夹中查看。如果用户需要进行多次的相同检索条件下的本地检索,特别是高级检索,在历史保存中,用户只需要打开以往的记录就可以查看到相应的检索结果,省去了重复设置的麻烦,由于该文件夹的内容会自动更新,以后新添加到系统的题录如果满足该搜索条件,即会自动在该文件夹出现,这对于追踪某一专题的发展趋势非常有用[6]。此功能方便科研人员对某类检索条件下的文献进行实时跟踪,掌握最新研究动态。
34 文件夹统计功能
在某一专题研究中,常常要对研究该专题的文献进行定量分析,如统计文献的年度分布、作者分布、期刊分布的情况等,以把握该专题的研究状况和发展趋势。利用系统的“文件夹信息统计”功能可以快速地实现以上目标。用户只需单击指定文件夹右键选择“文件夹信息统计”,就可以按照“年份”、“期刊”、“作者地址”等字段内容分别进行统计,结果瞬间可得,把其另存为一个新的文本文件后转入Excel中,即可利用Excel的作图功能对结果进行直观的分析,找出信息间的内在联系,实现知识的迁移和转化,有助于用户做文献调研的定量分析,从而快速了解某一领域的研究概况。
除上述功能外,系统的查重功能可以帮助情报服务人员快速的查找并统计三大检索同时收录情况,标记用以区分某篇文献被三大检索收录情况,题录更新可以帮助科研人员不定期对某篇文献的信息进行更新,下载全文功能可以方便科研人员就某篇感兴趣文献一键下载,等等。
4 题录信息导出
科研人员在对NE建立的三大检索系统数据进行分析比较时可能需要将数据库中的题录信息导出或与他人分享,情报服务人员利用此系统开展信息推送或开具检索证明等工作,如遇到此类问题用户不必再进入Web网站重新检索保存结果,只需利用NE提供的样式编辑器按照格式编辑出指定的样式并将题录导出即可完成,大大降低了用户手动编辑的工作,也提高了准确性。不过目前NE自带的样式编辑器是以GB/T 7714-2005《文后参考文献著录规则》为基础[7],并没有针对三大检索系统题录导出格式进行编辑,所以需要用户新建特定的如SCI题录导出样式编辑器。笔者对SCI题录导出格式及NE样式编辑器进行了详细的研究,并设计出了针对于SCI的样式编辑器,如图3所示,通过实际导出后与SCI题录导出样式进行对比,无太大差别,可以满足用户的实际需要。
图3 SCI样式编辑器
5 讨 论
NE参考文献管理软件通过对三大检索结果实现合理化的导入、管理及导出等操作建立信息管理系统,把不方便直接使用的网页信息分解成结构化数据并导入数据库,在NE系统平台上对导入的数据进行统计、查询、排序等工作,能够辅助科研人员快速锁定研究方向并对研究课题进行跟踪调研,也是情报人员开展信息服务工作的得力助手。当然,此款系统的搭建也存在着许多不足之处,例如尚无法实现三大检索系统题录字段格式的完全统一、数据更新功能还不够完善等问题依旧存在,不过通过开发人员对技术不断的改进和升级,NE的独特功能将会越来越全面,其与三大检索系统的融合也会越来越紧密。
参考文献
[1]王慧兰,李云庆,代俊秋.河北工业大学被三大检索系统收录论文的统计分析[J].河北科技图苑,2007,20(5):58-60,36.
[2]张大为.有关“三大检索系统”若干问题的评述[J] 西安工程科技学院学报,2002,16(2):174-179.
[3]谢奇,李立立,关中玉,等.NoteExpress——中文科技文献管理的绝佳助手[J].科技文献信息管理,2007,21(3):18-21.
[4]NoteExpress特色功能[EB/OL].http:∥www.reflib.org/indexchs.htm#Home,2010-02-23.
[5]NoteExpress参考文献管理软件20版简要教程[EB/OL].http:∥www.reflib.org/download/NoteExpre ssTutorial.pdf,2010-01-22.
[6]叶佩珍.基于NoteExpress的个人知识管理[J].情报探索,2008,(7):75-78.
[7]NoteExpress输出样式制作教程[EB/OL].http:∥www.reflib.org/supportcn/cgi-bin/topicshow.cgi?id=1459&h=1&bpg=1&age=0,2010-03-14.
[关键词]NoteExpress;SCI;EI;ISTP;信息管理系统
[中图分类号]G354 [文献标识码]A [文章编号]1008-0821(2010)05-0140-04
NoteExpress-based Information Management System of Three Major RetrievalLi Mao Xu Ziyuan
(Library,Yanshan University,Qinhuangdao 066004,China)
[Abstract]The NoteExpress is a document management software platform with the functions of documents retrieval,management and application.This paper aimed to establish a new information management system through importing retrieval results from the three important databases of SCI,EI and ISTP.Through the application of that the new system will be an excellent assistant tool for the evaluating university scientific research level,mastering the newest research development and increasing the efficiency of information service.
[Keywords]NoteExpress;SCI;EI;ISTP;information management system
《科学引文索引》(SCI)、《工程索引》(EI)、《国际会议录索引》(ISTP)为世界著名的三大科技文献检索系统,是国际公认的进行科学统计与科学评价的主要检索工具,其中以SCI最为重要。这三大检索系统在衡量一个国家,一个科研机构,一所大学的科研实力以及评估科研工作的社会效果等方面,发挥着重要的作用[1],也因此得到了从国家、学校到科研人员的高度重视。
随着高校对三大检索系统的利用率及查询数据的需求量逐年升高,有必要建立一款信息管理系统为评估高校专业科研水平、掌握最新科研动态以及情报服务人员开展工作提供辅助工具。笔者在对NoteExpress(以下简称NE)文献管理软件的使用中发现,因其在采集、管理、分析文献等方面均具有较完备及多种独特功能,以其为软件平台构建三大检索信息管理系统,能够方便有效的对超量信息进行统计处理,应该得到推广和广泛使用。鉴于此,笔者就如何利用三大检索查询结果与NE软件相关技术搭建信息管理系统作简要介绍。
1 查询结果导出
三大检索系统均包括印刷版、光盘版及网络版等3种出版形式[2],且因查询结果导出方法基本相同,所以笔者以更新周期短(每周1次),利用率高的SCI网络版(SCI Expanded)为例进行研究。
首先进入SCI Expanded网址http:∥isiknowledge.com/(只有订购用户有权使用),选择“Web of Science”检索平台,如图1所示,在搜索框中键入“yanshan univ*”(以燕山大学为例),检索范围选择“地址”,如需限制年限,可以在“入库时间”中选择所需年限范围,然后点击“检索”按钮进行检索。这里需要注意的是,因ISTP现已集成到Web of Science检索平台中,所以在“引文数据库”列出的5个选择范围中,要取消对ISTP数据库的选择,以免造成数据混淆。图1 SCI检索平台
在检索结果中,会列出符合检索条件的所有文献信息列表,其下方的“输出记录”一栏可以方便用户按步骤导出所需的相关文献信息记录,如图2所示。第一步就检索结果进行有针对性的选择或批量选择,SCI检索平台要求批量选择一次最多可以导出500条记录(EI为400条);第二步为选择记录输出字段,为了追求信息的全面性,这里选择“全纪录”并勾选“包含引用的参考文献”;第三步就所选记录进行本地保存,因为笔者是利用NE管理软件进行管理,所以在下拉菜单中选择“保存到其他参考文献软件”并点击“保存”即可完成查询结果的导出。图2 检索结果输出记录
2010年5月第30卷第5期基于NoteExpress的三大检索信息管理系统May,22 获取题录信息
在NE安装完毕后第一次运行时,系统会自动加载“示例库(sample)”[3]。为了建立三大检索信息系统,规范相关文献信息,用户可以通过NE界面上方主菜单【文件】的【新建数据库】新建一个命名为三大检索的数据库。在左侧目录树的题录文件夹下,可以建立3个名称分别为SCI、EI、ISTP的文件夹,以便存储各系统题录信息。NE提供了强大的题录导入功能,其导入文献资料的速度比国外同类软件快10倍以上[4],且由于各大数据库提供商导出的文献信息格式不尽相同,所以NE设计了包括三大检索系统文献信息格式在内的181个国内外数据库过滤器,用户可以根据自身需求新建、修改、删除相应的过滤器,并将题录信息经过“过滤”后置入NE中。
SCI导出的题录全纪录信息中包括AU(作者)、AF(作者全称)、TI(题目)等在内的32个英文标识,而NE自带SCI过滤器有效标识仅有22个,且其中某些英文标识与中文字段相对不符,为了更加全面及准确的显示题录信息,在导入题录信息前,需要对过滤器进行字段及标识的添加或修改。
点击NE主菜单【工具】→【选项】→【自定义】,选择“字段自定义”会弹出自定义字段对话框,选择相应的题录类型后,即可对相应类型字段进行操作。系统提供了添加字段、添加分组、移除、重命名、上移和下移等6个功能,用户可以根据需求进行操作。如SCI中另有ISI文献传递号,可以利用添加字段功能予以添加。自定义字段中的字段显示顺序即为NE主界面右下方题录相关信息中“细节”的字段预览顺序,为了使导入的三大检索系统基本信息实现统一化预览,可以利用删除、上移或下移等功能对主要字段区域进行合理化设置,方便用户快速预览和查找相关字段信息。
对字段进行相关操作后,便可以到过滤器编辑器中对相应字段与英文标识进行针对性的关联。点击NE主菜单【工具】→【过滤器】→【过滤器编辑器】,在弹出的对话框中查找并双击标题为“Web of Science”项,此时便打开了“Web of Science”过滤器编辑器,在“字段”栏目中,显示了当前过滤器字段与标识的关联情况,用户可以根据需要双击某条字段后查看或者更改关联情况,以确保导入的题录信息相对于NE显示的字段准确无误。为了尽量统一三大检索导入题录信息中作者名称的写法,“Web of Science”过滤器中的“作者”字段要更改为与“AF”(作者全称)进行关联,方便用户对信息更有效的管理和分析。
上述工作完毕后,用户便可以利用NE自带的导入题录功能将三大检索输出记录快速的导入到NE题录指定的文件夹下,初步的完成了三大检索信息管理系统的建立。
3 管理题录信息
NE参考文献管理软件具有比较全面的文献管理功能,不仅包含如添加、删除、编辑、排序等一般性管理[5],也包括自动分组、统计分析、形成统计图表等智能化管理,并且随着技术的发展和软件的成熟,管理功能将得到进一步加强和完善。
31 统一格式
由于三大检索系统录入题录信息格式各不相同,如作者有全程、简称、大小写之分,以wang guoqiang为例,SCI基本录入格式为wang gq,EI主要录入格式则有wang guoqiang、guoqiang wang、wang gq、gq wang等6种,为了实现三大检索题录信息统一化管理,且方便用户统计分析,需要将作者名称进行统一更改为wang guoqiang形式。点击NE主菜单【工具】→【批量替换】,利用批量替换功能将作者字段中的空格和“-”替换成缩进,“,”替换成空格,并且全部更改为小写字母,易于组织和统一检索。其他如wang gq等简写方式,需要用户与该作者确定后利用手动录入功能进行修改。
32 组织功能
NE独有的组织功能提供了作者、关键词及作者机构的枚举视图,排序方式均以英文首字母从A~Z排序,“作者”子节点将数据库中所有作者名称一一列出,方便科研人员及时掌握自身发表文章情况及跟踪某课题领域其他主要科研人员发表文章现状;“关键词”子节点列出了所有导入文献的关键词,有助于科研人员准确、有针对性的查找涉及某一关键词的相关文献信息并进行数据统计分析;“作者机构”子节点枚举了所有文献作者机构名称,该功能方便科研人员了解某一机构发表文章情况,及掌握某高校各个研究机构发表文章现状以用于评估专业科研水平。
33 站内检索
由于三大检索题录信息数量多,无法通过手动方式快速准确的寻找某条或某类记录,用户可以通过NE的快速检索或本地高级检索功能进行查找。在默认情况下,NE会保留最近5次(次数可更改)的检索历史,并可直接在数据库的树形结构“检索→最近检索”文件夹中查看。如果用户需要进行多次的相同检索条件下的本地检索,特别是高级检索,在历史保存中,用户只需要打开以往的记录就可以查看到相应的检索结果,省去了重复设置的麻烦,由于该文件夹的内容会自动更新,以后新添加到系统的题录如果满足该搜索条件,即会自动在该文件夹出现,这对于追踪某一专题的发展趋势非常有用[6]。此功能方便科研人员对某类检索条件下的文献进行实时跟踪,掌握最新研究动态。
34 文件夹统计功能
在某一专题研究中,常常要对研究该专题的文献进行定量分析,如统计文献的年度分布、作者分布、期刊分布的情况等,以把握该专题的研究状况和发展趋势。利用系统的“文件夹信息统计”功能可以快速地实现以上目标。用户只需单击指定文件夹右键选择“文件夹信息统计”,就可以按照“年份”、“期刊”、“作者地址”等字段内容分别进行统计,结果瞬间可得,把其另存为一个新的文本文件后转入Excel中,即可利用Excel的作图功能对结果进行直观的分析,找出信息间的内在联系,实现知识的迁移和转化,有助于用户做文献调研的定量分析,从而快速了解某一领域的研究概况。
除上述功能外,系统的查重功能可以帮助情报服务人员快速的查找并统计三大检索同时收录情况,标记用以区分某篇文献被三大检索收录情况,题录更新可以帮助科研人员不定期对某篇文献的信息进行更新,下载全文功能可以方便科研人员就某篇感兴趣文献一键下载,等等。
4 题录信息导出
科研人员在对NE建立的三大检索系统数据进行分析比较时可能需要将数据库中的题录信息导出或与他人分享,情报服务人员利用此系统开展信息推送或开具检索证明等工作,如遇到此类问题用户不必再进入Web网站重新检索保存结果,只需利用NE提供的样式编辑器按照格式编辑出指定的样式并将题录导出即可完成,大大降低了用户手动编辑的工作,也提高了准确性。不过目前NE自带的样式编辑器是以GB/T 7714-2005《文后参考文献著录规则》为基础[7],并没有针对三大检索系统题录导出格式进行编辑,所以需要用户新建特定的如SCI题录导出样式编辑器。笔者对SCI题录导出格式及NE样式编辑器进行了详细的研究,并设计出了针对于SCI的样式编辑器,如图3所示,通过实际导出后与SCI题录导出样式进行对比,无太大差别,可以满足用户的实际需要。
图3 SCI样式编辑器
5 讨 论
NE参考文献管理软件通过对三大检索结果实现合理化的导入、管理及导出等操作建立信息管理系统,把不方便直接使用的网页信息分解成结构化数据并导入数据库,在NE系统平台上对导入的数据进行统计、查询、排序等工作,能够辅助科研人员快速锁定研究方向并对研究课题进行跟踪调研,也是情报人员开展信息服务工作的得力助手。当然,此款系统的搭建也存在着许多不足之处,例如尚无法实现三大检索系统题录字段格式的完全统一、数据更新功能还不够完善等问题依旧存在,不过通过开发人员对技术不断的改进和升级,NE的独特功能将会越来越全面,其与三大检索系统的融合也会越来越紧密。
参考文献
[1]王慧兰,李云庆,代俊秋.河北工业大学被三大检索系统收录论文的统计分析[J].河北科技图苑,2007,20(5):58-60,36.
[2]张大为.有关“三大检索系统”若干问题的评述[J] 西安工程科技学院学报,2002,16(2):174-179.
[3]谢奇,李立立,关中玉,等.NoteExpress——中文科技文献管理的绝佳助手[J].科技文献信息管理,2007,21(3):18-21.
[4]NoteExpress特色功能[EB/OL].http:∥www.reflib.org/indexchs.htm#Home,2010-02-23.
[5]NoteExpress参考文献管理软件20版简要教程[EB/OL].http:∥www.reflib.org/download/NoteExpre ssTutorial.pdf,2010-01-22.
[6]叶佩珍.基于NoteExpress的个人知识管理[J].情报探索,2008,(7):75-78.
[7]NoteExpress输出样式制作教程[EB/OL].http:∥www.reflib.org/supportcn/cgi-bin/topicshow.cgi?id=1459&h=1&bpg=1&age=0,2010-03-14.