高校自主科研论文数据库构建之TPI模式

来源 :现代情报 | 被引量 : 0次 | 上传用户:wangdalu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]介绍了TPI系统的概况及其特点,探讨利用TPI系统搭建起我院教师科研论文全文数据库的步骤和方法,为我国数字图书馆的建设和管理提供一定的借鉴作用。
  [关键词]TPI系统;全文数据库;科研论文
  [中图分类号]G250.74 [文献标识码]A [文章编号]1008-0821(2010)04-0106-03
  
  TPI Mode for Database Construction of Independent Research Papers in UniversityLi Zhenjuan1 Sun Zhenling2
  (1.Library,Guangxi Traditional Chinese Medical University,Nanning 530001,China;
  2.Library,Xiangnan University,Chenzhou 42300,China)
  
  [Abstract]In this paper, characteristics of TPI system were introduced.Procedure and methods of forming the full-text database of research papers from university teachers using TPI system,which could provide reference for digital library construction and management to some extent,were thoroughly discussed.
  [Keywords]TPI system;full-text database;research paper
  
  科研论文是高校教师在一定阶段及一定科研领域中所取得的学术研究性论文和科研成果的文字(或符号)化的文献资源,其作用不仅体现在衡量教师个体的学术水平,更是衡量一所高校知识创新成效的重要依据。创建教师科研论文数据库正是为了搭建一个平台,规范管理各种科研成果,有利于为相关课题的深化研究提供有价值的文献信息资料。科研论文数据库也是高校图书馆特色数字资源建设的重要组成部分,有助于提高图书馆的服务能力和服务水平。本文通过探讨利用TPI平台创建我院教师科研论文全文数据库,建立起自身的特色数据库,从而为图书馆施行数字资源建设提供一个行之有效的实践参考。
  1 TPI概况TPI平台是清华同方光盘股份有限公司为大中小型信息服务机构开发的一个以内容管理为核心的数字图书馆解决方案,是一套基于网络平台上用于知识仓库创建、生产、管理、维护和发布的工具软件系统。它是一款以非结构化文档管理而开发的大型智能内容管理系统,以FTS全文检索数据库为核心,集成了全文检索服务器、字典管理、内容发布系统、元数据标引、分类工具、检查工具、光盘出版工具等模块。采用流行的B/S浏览器的检索方式和先进的3层C/S架构,能够同时管理文字、图片、多媒体等信息,并提供全文检索服务,支持网页的动态发布,是一个面向内容管理的数字图书开发平台。全文检索服务器(FTS)是为非结构化文档管理而开发的大型智能管理系统,具有以下几方面优点:一是检索信息快而且全,采用基于分词策略,可以同时对词和非词进行检索,并对检索结果进行相关排序,极大提高了检索结果的准确性。二是响应快:检索速度为100GB/1s。三是检索功能强大,提供多种检索方式和排序功能。内容发布系统完成图书馆数据的分布式采编入库,实现网站信息的发布与管理,实现动态实时发布,即发即得,立即生效。元数据标引工具、分类工具及检索工具都是采用TCP/IP与FTS相联接,实现分布式的并行数据加工,提高工作效率[1]。该系统完全兼容现阶段图书馆普遍使用的CNMARC标准,支持Dublin Core、MARC、RDF、Z39.50等多种国际标准[2]。良好的操作界面和完善的发布、检索功能使之能够提供功能强大的文献检索解决方案,还能提供高效的数字参考咨询服务。
  2 利用TPI构建教师科研论文数据库我们以广西中医学院教师科研论文为待建数字资源,以TPI为数字图书馆基础平台构建了我院教师科研论文数据库,不仅使我们熟悉了TPI的各项功能,也为高校特色数字资源建设提供了很好的范例。在建设数据库过程中,我们采取以下的策略和步骤(图1所示)。
  图1 数据库建设策略和步骤
   2.1 论证、调研通过查阅大量的相关文献,吸取国内建立各种全文数据库的经验,从数据库平台的选取、数据信息源、建库人员素质、技术设备及用户需求等多方面开展了可行性和技术论证,不但了解了国内目前在建设全文库方面的现状,而且也可以避免走重复性的建设的道路;对于建库人员的知识结构和综合素质、建库所需的硬件配置、软件环境及建成后数据库的前瞻性等方面都进行了分析。
  期高校自主科研论文数据库构建之TPI模式Apr.,2010Vol.30 No.42.2 搭建数据库平台搭建数据库平台包括安装TPI、选择模板类型、数据库命名、定义字段、设置数据库的发布选项和数字对象的命名方式,具体步骤如下:
  2.2.1 安装TPI平台及软件授权注册运行安装光盘上的安装程序Setup.exe,点击“Next”按钮,然后按屏幕提示进行安装即可。安装完成之后在服务器端或客户端点击“tpi”程序组中的“内容发布工具”,弹出页面后,点击“帮助”栏目下的注册,把服务器识别码以电子邮件的方式发送给软件供应商,以获得软件使用授权的注册码,最后进行注册;注册成功后,在服务器端启动全文检索服务器,这时整个TPI核心系统进行正常工作,用户就可以正常使用TPI系统了。
  2.2.2 确定数据库模板TPI系统提供各种不同种定义的模板类型,如:CNKI风格、Google风格、IE风格、OCLC风格、图片风格等等,不同的用户可根据自己的需要选择不同的模板。本数据库根据数据库的内容及用户群的特点选择了CNKI风格。因为清华同方数据库在我院拥有大量的用户群,使用此风格可以让读者有强烈的认同感,并且很快掌握数据库的使用方法。
  2.2.3 数据库命名及定义字段选择完数据库模板后,开始输入数据库信息,数据库信息包括:数据库名称、数据库路径、库加密串、数据库别名、创建人、数据库简介等。根据本数据库的特点,我们给数据库命名为广西中医学院教师科研论文全文数据库。在字段定义环节,根据本数据库的用途及实际需要,参考专家意见并反复试验与多次酝酿讨论,我们一共定义了10个字段,分别是:题名、作者、关键词、主题词、分类号、文摘、刊名、出版年、卷期、页码,且根据字段内容分别定义了字段的类型和长度,同时对这些字段的索引类型进行了定义。
  2.2.4 数据库的发布选项和数字对象的命名方式发布选项有3种即建立数据库时自动发布、数据只有检查后才能发布、在主页在线资源中显示数据库。数字对象命名方式有:保留原来的上传文件名,将上传的文件名改为时间序列命名,取数据库的字段值来作为文件名3种。根据本数据库的特点,我们选择了数据只有检查后才能发布方式,并采用保留原来的上传文件名方式命名。
  2.3 资源组织资源组织的过程也就是对纸质出版物进行数字化的过程,纵观国内的现况,目前主要以下3种方式:一是手工录入方式;二是以图像形式的方式,即用扫描仪等将文献的文字(包括图表)以图像形式录入光盘;三是图文结合方式,图文结合的方式较前二种方式优势明显,是目前建设全文数据库中较多采用的一种方式[3]。
  2.3.1 数据的收集与加工数据的收集范围主要来自期刊、论文和电子资源。收集完成之后,需要按照一定的规则对数据进行数字化加工、整理和组织,确保数据的高质量,而后对处理好数据引入数据库中,以便对数据进行下一步的深加工。
  2.3.2 数据的标引、归类和检查在全文数据库建设中,标引和分类的工作量通常很大,我们将这些标引工作分配给不同的用户账号,以方便进行多人并行工作。(1)由“管理员”启用“元数据加工工具”中的“分配任务”功能,将入库的原始数据分配给各“标引员”,标引员可直接从原文中拖选需要的内容进行标引。为了保证不同标引员标引结果一致,在开始此项工作前要先定好标引的规则,以确保数据库的统一性。(2)TPI利用可视化的操作界面实现数据分类的全过程,该模块在预制了标准的中图法分类体系的同时,也允许用户自定义分类体系。我们采用了模块中的中图法分类体系,将库中的记录进行分类,以方便数据的管理和访问。然后把已经标引好的各数据归纳到相对应的类目里,即完成了数据的归类工作。(3)数据检查是对入库数据的真实性和准确性进行质量控制,它是确保数据库高质量完成的重要环节。
  2.4 数据库的发布制作数据库的最终目的是发布出来供读者使用。内容发布平台CPS可满足用户的不同需要,把数据以各种风格发布到Internet上。TPI数据库发布向导会指导发布Web数据库的格式、风格等信息,主要有以下几个操作步骤:配置数据库的版权信息、选择数据库发布模板、选择要发布的字段、配置检索选项、设定各部分背景、字段及字段内容的颜色、字体大小,粗、斜体等,当完成以上发布设置,确认发布信息正确后,开始Web发布。
  2.5 教师科研论文数据库的管理与维护用户管理模块包括“用户”、“角色”两个模块。在用户管理模块里可以对检索者的IP限制、账号限制、时间限制和访问数据库权限制。未经授权用户无法进行相应的操作。而角色管理模块则确定了:系统管理员、数据库管理员、普通用户等,该功能非常适合高校不同读者的管理,既确保了系统的安全又方便了数据库管理[4]。为了预防数据丢失,TPI系统提供了三种数据库备份功能,分别是角色数据备份、用户数据备份、数据库数据备份。备份的方法均为一样,即在指定备份目标路径之后,单击“确定”按钮开始备份。通过修正数据错误,可确保数据库质量;通过数据的维护,可保证和提高系统运行的可靠性、安全性、协调性和运行效率;通过数据的更新,可保持所含信息的新颖性和有效性。
  3 本数据库的优点与特色
  3.1 简便易用,层次分明本数据库采用目前国内图书馆界构建特色数据库常用的TPI系统,该系统是一个基于内容管理为核心的数字图书馆平台,具有功能全面、使用方便、应用广泛的特点。以本数据库为例,TPI将整个数据库划分为数据组织、数据加工、结果输出等多个模块,条理清晰,整个系统架构清楚,易于使用和维护,再加上层次分明的人机操作界面,使得用户易于操作,易于掌握。
  3.2 功能强大本数据库在实际应用过程中显示了强大的功能。具体体现在以下几个方面:(1)数据收集全面完整。在资料收集中,凡是作者的单位含有“广西中医学院”的均属于我们的收集范围,均要收集,确保了资料的完整性。(2)工作效率高。在各个阶段,TPI都兼顾多人工作协同。数据收集阶段,我们分两部分同时进行,一部分负责查找电子资源;另一部分主要负责纸质文献的收集,同时进行,提高效率。在数据加工过程中,TPI提供了多人同时操作的功能,大大节省了建库时间。(3)数据库的建设具有可持续性。本数据库应用清华同方专业数据库制作管理系统,提供了简洁界面、分类清晰、查阅方便的数据资料查询系统,而且在此基础上还为不断补充和完善数据库资料提供了可持续建设的余地。(4)数据库以主页方式发布数据库信息,用户只需要普通的IE浏览器即可使用数据库,方便简捷。本数据库采用CNKI方式发布,检索界面及检索功能和清华同方全文数据库一致。
  4 数据库建库中需注意的问题
  4.1 质量控制问题我国对特色文献数据库的质量评价尚没有制定一套明确的评估指标。综合考虑,影响数据库质量的要素大致有以下七方面:一是选题的新颖性、针对性和特色性。二是数据的准确性、完整性和规范性。三是管理系统的性能。四是数据库的共享性和可扩展性。五是数据库的安全性。六是可维护性。七是效益性。其中“数据的准确性、完整性和规范性”是影响建库质量的最重要的因素,它直接影响数据库的检索性能。为此要控制好三个方面:其一,标引词准确性控制。其二,标引工作规范控制。其三,标引人员的管理和技术控制[5]。我们在构建教师科研论文全文数据库时,为了尽可能提高数据标引质量,还制定了相关的规则,对标引人员也进行了相关的培训。
  4.2 知识产权保护问题文献数字化的知识产权问题实际包括两个层面:一是如何解决原始文献的知识产权;二是数字化资源本身的著作权问题[6]。在本数据库中,因原始文献主要为学校的教师科研论文,且数字化后只在学校局域网发布,供校内使用,很好地解决了知识产权问题。公开发表在印刷版刊物上的论文同样受到版权保护,因此,在建库之初我们就会同科研处采取整体签约和备忘谅解的方式获得期刊和作者同意论文被收录。我们还以学院的名义要求,在今后发表的科研论文需要注明被我院科研论文数据库无偿收录,为后续工作扫清障碍。数字资源建设目的之一就是为了与其他机构实现资源共享,这类型的知识产权问题尚待进一步研究。
  4.3 增加建设资金和硬件设备升级问题采用先进的、整体性能好的图书馆自动化管理系统,是保证特色数据库质量的物质基础。图书馆建设经费不足,可使所购软件系统不能够完善配套、网络运行速度慢、安全性能差。我们应争取决策层的支持,一要增添和升级软硬件设备;二要精打细算,充分发挥现有设备的作用。
  
  参考文献
  [1]孙长虹.TPI系统与高校图书馆特色数据库建设[J].黑龙江科技信息,2008,(9):82.
  [2]于立国.TPI系统与数字化图书馆建设的需求[J].哈尔滨市委党校学报,2005,(6):94.
  [3]李璐.古籍全文数据库建设的技术与实践[J].图书馆学研究,2004,(11):22-25.
  [4]叶岚.基于TPI系统构建“姑苏桥文化专题数据库”[J].中国科技信息,2008,(5):130-132.
  [5]吴涛,李锋.基本TPI的特色数据库建设实践[J].现代情报,2005,(7):165-168.
  [6]周玉山,张岚.山东地方文献全文数据库开发略述[J].山东图书馆季刊,2006,(3):86-89.
其他文献
本文对项目型组织的特点和知识风险的类型进行了分析,并针对项目型组织人员流动率高,知识管理困难,知识流失严重的特点,设计出项目型组织知识风险管理模型,将其划分成知识风
本文首先简介WIKI技术的特点,详细阐述WIKI技术应用于数字图书馆建设的各个方面.如知识管理工具、信息交流平台、协作搜集信息、学术课题研究、会议内容拓展、辅助参考咨询、建
在全球能源紧张的状况下,新能源产业的发展是大势所趋。锦州市被辽宁省确定为光伏产业发展基地,做为锦州市图书馆界要发挥图书馆的优势和特点,从主动参与、提供服务出发,为光
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
机构库是绿色OA模式,它对于缩短科学研究周期,促进学术成果共享,提高本机构的学术影响力具有重要意义。存档政策、开放政策、以及可持续发展策略是OA机构库建库过程中的关键
虚拟社区的发展为在线用户的知识共享提供便捷的途径,但目前社区中普遍存在着一些知识交流效率低下的现象。知识管理对社区成员的知识共享与交流的方式具有重要的影响,笔者从
为论证运动项目是体育产业"元"逻辑,为我国体育产业健康发展敲响"固本"警钟,本文运用文献资料、比较研究等方法,从历史演进视角、文化视角、产业链视角分析运动项目与体育产
<正> 一、病史摘要患者:沈姓,男,65岁.退休工程师.门诊号:3-719.1960年12月16日来我院中医科"研究门诊"就诊.严重失眠一个半月,全身出现不自主的振摇抽动约月余.望诊:体格中
<正>一、课题的提出(一)研究背景:1、教育信息化发展的需要。近年来,随着科学技术的发展,教育信息化对传统教学产生了巨大的冲击,新的教育教学理念、模式方法在教学领域不断
会议