论文部分内容阅读
摘 要机构知识库是促进学术交流和知识创新的重要形式,论文对CNKI所收录的259条有效记录进行文献计量分析,对关键词进行标准化处理后将所有文献进行主题划分和归类,从版权协议与政策规范,数据标准与系统平台,组织结构与模式模型以及指标体系与评估评价等四大主题对IR的研究文献进行归纳总结,并提出几点现实问题。
关键词机构知识库文献计量开放存取资源共享信息政策
分类号G250.7
0引言
机构知识库(Institutional Repository,IR)又称为机构典藏或机构库,至今没有统一的定义。SPARC高级顾问Raym Crow认为IR是获取并保存大学社区智力产出的数字化集合,是学术机构面临的战略问题的具体回应,即通过分类出版结构的激励创新提供学术交流改革的核心组成部分,并充当有形机构的质量指标以提高其知名度、信誉和公共价值,机构知识库的内容由制度界定(Institutionally defined)、学术性(Scholarly)、永久累积(Cumulative and perpetual)以及开放和互操作性(Open and Interoperable)等要素构成[1]。从OpenDOAR网站统计数据可知,截至2013年9月初,全球已有106个国家或地区的2419个机构加入,其中美国以304个位居第一,中国大陆加入OpenDOAR的IR数量已经达到35个[2]。国内外学者从不同角度对IR展开了积极探讨和实践探索,积累了丰富的学术成果和成功经验,系统梳理和总结已有文献对进一步优化和提升IR运行能力以及制度环境有积极的理论借鉴意义,本文从文献计量的角度对相关主题进行划分述评。
1数据来源与研究方法
中国学术期刊网络出版总库(简称CAJD)收录了约96%的核心期刊,是国内连续动态更新的最大的知识资源检索数据库。为了便于对文献内容进行主题划分和评述,以展现国内近十年机构知识库研究的热点、难点和焦点,本次选用CNKI(中国知网)所属的CAJD总库进行主题检索,检索条件设定为:篇名=“机构库”OR“机构知识库”OR“典藏库”OR“机构仓储”OR“机构存储”OR“机构典藏”,来源类别=“核心期刊”和“CSSCI(含扩展板)”,其他为默认选项,检索日期为2013年10月2日,共找到272记录。凡记录中含有部分类如会议通告、专题介绍、部门广告以及优先出版等非学术论文或重复内容的结果进行数据清洗,清洗后共得到259条有效记录。这里需要说明两点,其一,本次文献统计的数据仅来源于CNKI(中国知网),会漏掉部分知网没有收录的期刊,所以图示中的文献数据并不能代表该年份发表论文的最高统计值;其二,由于数据清洗带有一定的主观性,有可能因为疏忽而漏掉有统计价值的文献。基于本次检索对象的数据量偏小且主题集中等特点,因而可以忽略不计这些微小影响因素。
2文献分布规律及主题分类
2.1文献年度分布情况
从文献年度数量分布图(图1)可知,IR研究主要分为两个时期,2004年至2010年为增长期,文献数量从2004年的1篇迅速增至2010年的54篇并到达最高峰,随后文献数量萎缩至2013年的12篇。由于2013年的数据量只统计到了当年的7月份,如果按照一般规律推算,全年的数据量将超过20篇,以2010年作为对称轴将曲线展开,2009年和2011年的文献数量相差不大,数量为48±1,再各自增减一年,2008年和2012年的数据量分布情况类似于前者,照此规律推测,2013年的数据量将在20左右,是一个衰落期的缓冲时点,类似于2007年在增长期的角色。随着国家社科基金项目和其他资助项目的不断推进,机构知识库的研究热度将趋于平缓,主要问题也得到解决,接下来将是理论与实践的融合期,并以此为研究的重点,查漏补缺是科研创新的一个重要方面,在IR研究中也同样适用。
图1机构知识库研究文献年度数量分布图
2.2载文期刊分布情况
将检索结果导入Excel中统计期刊分布情况如表1所示,具体情况分析如下:(1)259篇IR研究文献分布在30个不同期刊,期刊共分为8大类,其中载文量为1篇的期刊有5个,占总数的16.67%,图书情报类期刊数量最多且发文量也最大,所属期刊数量占总数的63.33%,所发文章数量占总数的93.82%;(2)发文量大于5篇的期刊均为图书情报类,有5类期刊仅刊发了1篇文章,且每类期刊仅含一个杂志,属于IR研究的边缘刊物,说明国内IR研究的重要群体分布在图书情报界。(3)载文量最大的期刊是《图书情报工作》(JA,37篇),其次是《情报杂志》(JB,21篇)和《图书馆学研究》(JC,18篇),需要说明的是JA和JC都是半月刊,JB是月刊,同属CSSCI(含扩展板)来源期刊,发文周期较快,能够及时地传播IR研究的最新动态信息。(4)发文量≥10篇的期刊有13个,《中国教育信息化》刊文量为5篇,占非图情类期刊发文量总数的37.5%,CSSCI来源期刊(C刊)共有9个,全国中文核心期刊(PKU)有21个,分别占总数的30%和70%,C刊和PKU各发表论文245篇和14篇,分别占总数的94.59%和5.41%,说明IR研究文献质量普遍较高。
表1 机构知识库研究文献期刊分布表
2.3文献主题的规整及分类
对所有文献的关键词进行标准化处理,主题词的确定标准是将相同或近似含义的关键词重新规整为一类,并将较长的复合词汇拆分,同时剔除类如 “分析”“现状”“问题”等非关联关键词。处理后的主题词及词频分布详见表2,括号内数字为词频。
表2机构知识库研究文献主题分布表
注:将“数据模型”归入“数据标准与系统平台”主题,而“能力成熟度模型”归入“指标体系与评估评价”主题,部分频次为1的关键词含义表述不清或过于宽泛(如“比较”“学者”等),这类词汇没有统计在内。
为了便于读者理解和分析,需要对部分操作方法进行说明,具体筛选过程如下。
(1)将“机构知识库”(162)、“机构库”(47)、“机构仓储”(24)、“IR”(13)、“机构典藏”(9)、“机构典藏库”(6)、“知识库”(5)、“学术机构知识库”(3)、“联合机构仓储”、“高校机构知识库”、“数字仓储”(2)以及“OpenIR”、“学术典藏库”(1)等词汇归入“机构知识库”主题,由于本文检索对象是IR,因此,IR不能作为独立的主题内容。
(2)将同义词“开放存取”(43)和“开放获取”(32)合并为“开放存取”主题。
(3)版权协议与政策规范是一个重要的主题内容,属于IR建设和运营过程中相对于系统平台的“软环境”。
(4)“美国”(2)、“日本”(4)、“德国”(1)、“印度”(1)等国家以及“台湾”(5)、“台湾地区”(4)、“香港”(2)和“港台”(1)等地区是涉及面较广的词汇,所属文章的内容具有多样化特点,不能单一地将这类词汇汇入某一主题。
(5)频次为1的关键词占总量的78.83%,频次大于10的关键词有8个,其中排名Top5的关键词均为IR或OA,说明IR的建设和运行与OA运动密切相关。含有“图书馆”的关键词总频次为35,在所有关键词中处于高频词,说明IR与图书馆有较强的关联度。“版权”“著作权”和“知识产权”也是高频词,说明IR政策法规研究也是重点。
3文献主题内容分类述评
3.1版权协议与政策规范
IR建设和运行中的版权处理问题引起了学者们的重视,积攒了较多的理论成果,但案例分析偏少且对策建议的针对性较弱,国外的先进经验为我国IR的制度优化提供了良好的借鉴意义。柳菁[3]从政府强制开放存取、开放源代码软件和知识共享许可协议(CC协议)三个主要实践方式引介了美国处理IR版权问题的做法,包括国立卫生研究院(NIH)、治疗中心法案(CURES)以及联邦研究公共存取法案(FRPAA)等机构或法案的强制性OA政策,她认为美国的IR版权政策对我国的有益启示主要有5点:①注重IR建设中利益相关者的权利义务协调与平衡;②健全政府主导的产权管理规范;③坚持面向开放共享的“合理使用”原则;④鼓励开放存取以支持IR的可持续发展;⑤制定因地适宜的CC协议以降低版权侵权风险和运行成本。面向开放式公益服务的IR在资源建设、服务和管理过程中很容易引起资源内容与软件技术使用方面的版权侵权风险,而且这种风险形势日益严峻,已经成为影响IR可持续运行的现实问题。李彩萍[4]介绍了美国、澳大利亚和欧盟关于数字作品传播的版权法规,对比了开源软件(如Eprints构建工具)和商业软件使用所带来的潜在风险,她认为IR的版权风险控制应从政策和协议两个层面展开:①要加强IR版权政策的研究和指导,引导商业出版机构作出政策调整以适应新环境的需求;②应加大存储许可协议、版权转让协议和知识共享协议的管理力度,为了提高科研数据的开放水平并提高知识创新的效果,IR知识资源利用中的版权风险控制应建立在合理使用原则的基础上,加强用户权限管理,并鼓励有条件的机构采取OA政策及其对应的出版模式。
随着开放存取运动的进一步深入发展,著作权问题已成为影响IR构建与服务的重要因素之一。李晨英和杨国栋等[5]从定义、内容、版式、著作权和IR利用许可等五大要素对比分析了作者版本和出版发行版本等两种类型的联系和区别,指出目前版权政策主要有“允许自存档、提供免费阅读和倡导开放存取”等三种形态,他们根据本校的实践效果,在IR处理期刊论文著作权问题中逐渐形成了“尊重著作权、合理收集与利用以及个性化研究”的原则和“在元数据及其内容中明示版权特征”的处理方法。张晓林、张冬荣、李麟等[6]认为依据《著作权法》和投资获利的正当性,公共机构可依法并应该保证享有所保存知识成果的著作权利,在总结归纳15份来自不同国家、地区或机构的政策法规基础上,他们提出了IR内容存缴与利用的权益管理机制:①设定一系列的条件与限制以界定知识成果使用中的权利义务关系;②为了避免限制措施带来的冲突和误解,应实施针对性的利益平衡策略;③应实施促进传播的广度和增值服务的深度以及机构学术影响力等正面强化措施,实施保护作品完整性,促进作品的正确使用以及加强主体责任意识等负面消减措施;④从政策支撑、服务支撑和环境支撑三个方面加强权益博弈和风险管理以提高知识资产保护和开发的科学性。
3.2数据标准与系统平台
IR是一种旨在促进知识传播和共享的数字化资源管理平台。目前可见的系统平台至少有10种,常见的是DSpace、EPrints和Fedora等,它们所要解决的问题基本一致,但体系结构却各不相同,元数据标准和规范也存在差异,因此IR之间的互操作就成为一个阻碍数据共享的障碍。OAI-ORE是为解决分布式数据交换而制定的规范,它也是基于Web架构的独立性抽象数据模型,对于解决分布式IR之间的互操作问题有重要意义。陈晓凤和张志平等[7]选择DSpace系统平台以实现ORE数据模型与DSpace架构之间的映射、资源图的URI发布以及数字资源的收割,展示了OAI-ORE在IR中实现复合数字资源的知识表示以及库间互操作等业务范畴内的积极作用。关联数据(Linked Data)一般采用RDF(资源描述框架)建构数据模型,利用URI(统一资源标示符)定义数据实体,并通过HTTP协议浏览并获取数据,是实现Web数据共享的一种常用方法。徐华[8]认为关联数据经由关联规则映射后输入至知识环境中实现IR知识服务,利用汉化版的Dspace软件构建基于关联数据(关联规则)的外部协作系统以实现个性化的检索、定制和推送服务。王思丽和祝忠明[9]认为选择适当的关联数据源,利用RDF进行知识呈现、语义标注和关联映射,以CASIR为应用平台,实现IR的语义拓展。关键技术包括实体关系的语义揭示、数字对象的知识组织以及实体数据语义标注等核心方法。拓展模块的实现步骤包括实体关系的抽取和添加约束规则、语义标注和关联以及模块测试和运行等流程。经过实验表明基于语义扩展的IR比传统IR在内容和资源组织方式上更具优势,为CASIR实现从基础服务到集成服务的转型提供了技术支撑和运行环境。
具有优势的IR联盟也有现实问题:同一IR内的资源访问权限,不同IR用户的角色转换和身份认证,跨机构的认证技术和授权方案都成为知识资源共享的障碍,其中既有制度因素,也有技术因素。常用的访问控制和授权技术包括:①IP限制、账户密码保护和个人凭证等认证方法;②自主访问控制(DAC)、强制访问控制(MAC)和基于角色的访问控制(RBAC)等访问控制模式,其中RBAC是目前应用最广泛的策略;③Web Proxy、Kerberos、PKI和SMAL在内的单点登录(SSO)用户管理机制。马建霞[10]比较分析了10个不同国家的认证联盟,其中对IR联盟跨库认证和授权最有适应性的是基于SAML和XML Schema的体系结构和策略框架以及开源软件的Shibboleth项目。Shibboleth2.0架构主要由身份提供者(Identity Provider)、服务提供者(Service Provider)、WAYF服务和Shibboleth访问控制等流程和机制组成,它具有易于实现跨库访问管理、良好的安全性和可扩展性、细粒度和分布式的访问管理控制、丰富的资源支持以及易于移动访问等特点。国外的IR联盟在跨库认证方面作出了有益尝试,她认为基于SAML开放标准的Shibboleth在IR访问控制方面具有可靠的应用前景。
Dspace是基于Web服务的易用平台。中科院国科图兰州分馆从2006年起开始基于Dspace系统进行主题学科的机构知识库平台(CAS-IR)建设和应用,拓展开发的原则是保持固有分层封装和调用机制的完整性和可维护性,同时设置IP访问权限和API功能模块。祝忠明和马建霞等[11]设计了基于“JSP+Servlet”的WebUI工作机制,功能模块包括:①涵盖内容描述、文件上传、信息检查和应用许可的提交步骤及工作流程;②涵盖内容转换、批量导入以及可视化选择和映射的数据导入模块;③基于学科主题分类树和内容类型的扩展性浏览/检索功能,以及包括数据收藏、交换、利用统计、关联检索、书签收藏和引用方式在内的系列延伸服务;④包括访问利用统计和资产状况审计在内的知识资产审计功能模块;⑤用户管理模块包括用户注册的识别、权限分配以及文件的解析处理等;⑥SRU检索服务接口采用OCLC开发的SRW/U开源软件工具包,同时还对用户界面的优化提出改进意见。Dspace的“应用层→业务逻辑层→存储层”分层架构设计具有良好的拓展性能,具有集成化优势的开源软件包提高了数字资源利用的效果和效率,参数化配置设计提高了IR的灵活性,协同开发环境也为IR的合作开发进程提供了制度基础。
3.3组织结构与模式模型
韩国dCollection(DC)机构库是典型的全国性共建共享模式,DC体系结构由数据供给系统(DPS)、OAI-PMH协议和服务供给系统(SPS)等构成,建设IR能丰富和优化本馆信息资源,为资源共享提供基础。孟祥保[12]认为我国的IR建设应借鉴区域性图书馆联盟的建设模式为IR提供逻辑参考框架,机构库联盟将成为未来发展的主要趋势,分布式的开放存取平台将是数字整合服务的最佳选择。陈淑珍和韩珂等[13]从IR总体组织建设和推进的角度总结出国外IR的主要模式:①由图书馆或信息中心发起和参与并将IR服务推广至整个机构层面的自下而上模式(M1),其建设主体是高校或科研机构,如麻省理工大学(MIT)的DSpace@MIT项目和加利福尼亚大学(UC)的eScholarship项目,M1模式具有速度快、宣传广和覆盖面广等优势,同时也具有缺乏决策层支持、执行不力和人员认同率较低等发展困境;②由机构决策层和管理层规划、部署并推动的自上而下模式(M2),但M2模式与M1模式具有同样的建设主体,M2具有人财物的有力保障、资源得到统筹协调等优势,这种内在优势将促进政策执行,是具有潜在发展前景的IR组织模式。他们在分析国外的建设现状和国内的现实环境基础上,认为我国宜采用M2模式,具体的实施步骤与策略包括:争取上级支持、组建工作团队、确定建设目标,制定标准规范、设计服务功能、构建技术平台以及加大服务推广等。
台湾学术机构典藏(TAIR)是一种典型的IR联盟建设模式,即按照学科或地缘的关系,通过充分的调研和规划并选择合作伙伴,按照既定政策方针构建IR联盟,可以扩大知识成果的传播、共享及利用,提高机构的学术影响力及地位。傅晔[14]梳理TAIR特点,认为TAIR采取的是“自上而下”的构建策略,因此容易获得上级主管部门的支持和认可,她提出构建省域级高校IR联盟的建议,相应的措施或战略包括:①争取各级部门的重视和支持以保障人财物的建设需求;②搭建跨库检索平台,提高信息资源利用效率,如采取“中心+分机构+参与机构”的组织模式和“分布存储、集中呈现”的服务方式;③设置著作权指南和FAQ(常见问题)栏目,签订许可协议以避免产权纠纷;④采取“自上而下”的强制性存缴制度。从长远发展角度来看,设立讲解讲座课堂,加大推广宣传力度,能够增进公众对IR的认可度。
王颖洁[15]认为我国IR建设模式不能照搬国外经验,而应从人文环境、管理体制和知识产权等实际问题出发,构建一个面向现实国情的特色IR模式,包括以下几个方面:①以促进学术交流、知识共享与创新为建设目标;②以高校的科研机构为主要实施对象,以高校自有资金和政府拨款为财力支撑;③以Dspace的组织结构、Eprints的主题划分以及Fedora的拓展性分层模式为样板,根据具体需求进行改进和变革;④以联盟项目为组织方式并由上级主管部门进行业务指导以及由承担机构负责具体实施;⑤突破出版商对作品知识产权的绝对控制,同时加大宣传力度并获得上级部门的支持和本单位职员的拥护;⑥构建基于OAI-PMH 协议的收割式服务模式,她以某大学为例,对IR应用流程进行设计,即包括内容建设、数据处理与保存、资源共享以及检索使用等四大流程,认为我国IR建设的趋势是在不断普及化的过程中实现协作化的区域性联盟发展。依据当前的国情,我国电子出版物呈缴制度尚处于完善阶段,各方面条件都不成熟,吴有梅[16]认为“呈缴模式+激励政策”是目前最佳方式,其中呈缴模式可以根据具体情况采取多样化策略,如强制性的法定呈缴,主动性的协议呈缴等。呈缴模式属于IR建设的配套设施,应在资源获取、财务支持以及技术保障等方面加大力度。国外一些大学利用Dspace 系统模型构建了数字资源社区,这种模式为大学机构库的建设提供了良好的示范作用。IR的建设和运行是一个涉及多部门协作的管理活动,宛玲和苏娜等[17]认为应将所有关联部门纳入整体性框架中并实现职责分工,但不应过于依赖组织的主动协调,因此需要构建跨部门协作管理模式以增强IR运行的灵活性和机动性,同时还应保持与外部信息环境的交换与整合。
3.4指标体系与评估评价
数据质量是用户访问IR数字资源时最关注的要素,也是评价IR建设成效的关键。元数据是对信息资源内在特征和属性的结构化描述,为各种形态的数据集提供规范化的检索方法,但是随着IR存储量的指数级增长,建立元数据的传统方法已经无法保证其质量和效率,自动化处理方式是必然选择。元数据提取(Metadata Extraction)和元数据收割(Metadata Harvesting)是常用的元数据自动生成办法。在IR的构建过程中,自动生成元数据速度快、效率高且成本低,但能否在检索中准确匹配和应用则取决于元数据质量。为了便于实际应用,林爱群[18]认为应建立一整套元数据质量评估和评价体系,即基于Gasser and Stvilia框架体系以及Bruce and Hillman框架体系的框架指标,包括元数据(加权)完整性和元数据精确性等两项重要指标,以及期望一致性、逻辑一致性、可达性和时效性等一般性指标,共同构成一个完整全面的元数据质量评估体系。
自存储是IR容量积累的重要方法,也是评价IR效果的组成部分。现有的自存储评价暴露出作品创作者权属不清和文档内容调查较少等缺陷。郭清蓉[19]认为自存储评价指标应集中于文档数量和质量方面,影响自存储评价的因素包括存储者信任、存储数量、全文可获得性、创造者态度、每次存储费用、可用性、互操作性以及版权、质量控制、利益相关者态度和软件系统等。评价体系包括IR内外部评价、经济评价和技术评价等4个一级指标,7个二级指标和16个具体指标。评价体系的构建从侧面反映出社会公众对IR的期盼和要求,但同时也需要在实践中不断调整和改良。邓君和韩毅[20]认为IR内容建设方面还受到固有传统文化和法律保障因素的影响。除此之外,还受到技术、标准和其它因素的影响,应继续深入探寻这些影响因素的内在根源并据此提出针对性的改进意见和可操作性的应用方案。
可用性是IR建设初期软件系统评估的一个重要质量指标,对用户而言,可用性涉及系统的性能、流程和效果,对操作人员而言,可用性是系统存在的前提条件和运行基础并关系着系统开发的成败,因此,对构建IR的各类软件可用性进行评估,对提高质量、优化性能、提升影响力和促进可持续性发展有着积极意义。洪梅和马建霞[21]认为IR软件的可用性评价指标包括有效(Effectiveness)、交互效率(Efficiency)和用户满意度(Ssatisfaction)三大维度。通过对国外6所大学的开源IR软件可用性评估的案例分析,构建了两类可用性评估方法:①没有用户参与的评估方法,包括对比评价、认知走查法(CW)和启发式评估(HE)等三种典型方法;②有用户参与的评估方法,包括选择代表性用户、设计测试任务、确定测试地点、记录数据和分析结果等五个主要环节。金瑛[22]从内因和外因两个方面归纳总结了国外IR存储行为影响因素,内因主要包括对IR的基本认识和价值把握、学科文化理论及存储经历、对存储内容质量及产权的信任;外因包括数据转换、系统架构和容量扩展等技术问题,强制性政策、鼓励政策和联系制度等存储政策,先导性项目的示范作用等。她认为探索更多的影响因素并构建科学合理的IR存储模式是未来一段时间内的研究重点。
4结语
机构知识库的建设和运行是一项涉及多方面利益关系的系统性工程,需要在长期的探索中不断优化和完善。经过对近十年来IR研究现状的归纳总结,主要发现以下几个问题:①国内最欠缺的不是技术而是面向本土化科研语境的制度规范,学者们的研究重点多在展示国外的IR制度形态,对国内IR运行的版权(产权)归属问题的阐述和解释无关痛痒,这是目前软环境建设亟待面对的现实问题,知识产权(尤其是数字资源)保护和规范仍是一个复杂问题;②国内IR建设的技术架构、数据标准和系统平台初见端倪,部分学术机构已经在积极构建面向本领域或本单位的自有机构知识库,而忽略了整个科研体系内的数据资源共享,“各自为政”的现象依然存在,同时IR内容容量较小且获取程序不够人性化,技术已经上位,但服务却失位;③一个健康可持续发展的IR需要进行科学的评估和评价,国内相关研究处于起步阶段,各种评价标准仍过于粗放和宽泛,针对性的评估体系尚未完成,这是IR建设的保障机制也是长期发展的制度环境,这方面工作亟待加强和改进,同时还应注意重复建设和资源浪费问题,短期内实现区域性IR联盟协作仍有一定难度,利益分配和权责定位仍是主要障碍。
参考文献:
[ 1 ]Raym Crow.The Case for Institutional Repositories: A SPARC Position Paper[EB/OL].[2013-09-17].http://scholarship.utm.edu/20/1/SPARC_102.pdf.
[ 2 ]Directory of Open Access Repositories. Search or Browse for Repositories[EB/OL].[2013-09-13].http://www.opendoar.org/find.php?format=charts.
[ 3 ]柳菁.美国机构知识库版权问题的解决方式及启示[J].情报科学,2013(5):157-160.
[ 4 ]李彩萍.论机构知识库的版权风险及其控制方式[J].图书馆理论与实践,2013(7):31-34.
[ 5 ]李晨英,杨国栋,臧琳,等.机构知识库收录期刊论文涉及著作权问题的解决途径探讨[J].大学图书馆学报,2010(1):74-79.
[ 6 ]张晓林,张冬荣,李麟,等.机构知识库内容保存与传播权利管理[J].中国图书馆学报,2012(7):46-54.
[ 7 ]陈晓凤,张志平,白海燕.OAI-ORE在机构知识库中的应用研究与实现[J].现代图书情报技术,2010(11):69-74.
[ 8 ]徐华.基于Dspace和关联数据的机构知识库合作服务模式构建研究[J].情报科学,2012(7):1021-1024.
[ 9 ]王思丽,祝忠明.利用关联数据实现机构知识库的语义扩展研究[J].现代图书情报技术,2011(11):17-23.
[10]马建霞.机构知识库联盟的认证和授权的技术机制分析[J].图书情报知识,2010(4):90-95.
[11]祝忠明,马建霞,卢利农.机构知识库开源软件DSpace的扩展开发与应用[J].现代图书情报技术,2009(7/8):11-17.
[12]孟祥保.韩国机构库建设模式研究:以dCollection为例[J].图书馆杂志,2009,28(12):59-62.
[13]陈淑珍,韩珂,祝忠明.我国大学机构知识库建设的模式选择与实施策略[J].图书馆杂志,2009(8):52-54,77.
[14]傅晔.TAIR对我国大陆高校机构知识库建设的启示[J].图书馆工作与研究,2011(12):78-81.
[15]王颖洁.我国机构知识库模式构建与流程设计[J].图书情报工作,2008,52(4):104-107.
[16]吴有梅.论机构知识库建设中的呈缴模式[J].图书馆理论与实践,2010(3):33-36.
[17]宛玲,苏娜,厉志红.大学机构知识库组织管理问题研究[J].图书情报工作,2008(4):97-99.
[18]林爱群.机构知识库元数据的自动生成与评估研究[J],图书馆学研究,2009(7):10,21-23.
[19]郭清蓉.机构知识库自存储评价体系的构建[J].情报杂志,2009,28(7):73,74-76.
[20]邓君,韩毅.机构知识库发展的文化法律影响因素研究[J].情报科学,2008(6):918-923.
[21]洪梅,马建霞.开源机构库软件可用性评估方法的探讨[J].现代图书情报技术,2007(12):6-10.
[22]金瑛.机构仓储存储行为影响因素研究述评[J].图书馆建设,2010(4):14-17.
王晴 山西大学经济与管理学院2011级情报学硕士研究生。山西太原,030006。
关键词机构知识库文献计量开放存取资源共享信息政策
分类号G250.7
0引言
机构知识库(Institutional Repository,IR)又称为机构典藏或机构库,至今没有统一的定义。SPARC高级顾问Raym Crow认为IR是获取并保存大学社区智力产出的数字化集合,是学术机构面临的战略问题的具体回应,即通过分类出版结构的激励创新提供学术交流改革的核心组成部分,并充当有形机构的质量指标以提高其知名度、信誉和公共价值,机构知识库的内容由制度界定(Institutionally defined)、学术性(Scholarly)、永久累积(Cumulative and perpetual)以及开放和互操作性(Open and Interoperable)等要素构成[1]。从OpenDOAR网站统计数据可知,截至2013年9月初,全球已有106个国家或地区的2419个机构加入,其中美国以304个位居第一,中国大陆加入OpenDOAR的IR数量已经达到35个[2]。国内外学者从不同角度对IR展开了积极探讨和实践探索,积累了丰富的学术成果和成功经验,系统梳理和总结已有文献对进一步优化和提升IR运行能力以及制度环境有积极的理论借鉴意义,本文从文献计量的角度对相关主题进行划分述评。
1数据来源与研究方法
中国学术期刊网络出版总库(简称CAJD)收录了约96%的核心期刊,是国内连续动态更新的最大的知识资源检索数据库。为了便于对文献内容进行主题划分和评述,以展现国内近十年机构知识库研究的热点、难点和焦点,本次选用CNKI(中国知网)所属的CAJD总库进行主题检索,检索条件设定为:篇名=“机构库”OR“机构知识库”OR“典藏库”OR“机构仓储”OR“机构存储”OR“机构典藏”,来源类别=“核心期刊”和“CSSCI(含扩展板)”,其他为默认选项,检索日期为2013年10月2日,共找到272记录。凡记录中含有部分类如会议通告、专题介绍、部门广告以及优先出版等非学术论文或重复内容的结果进行数据清洗,清洗后共得到259条有效记录。这里需要说明两点,其一,本次文献统计的数据仅来源于CNKI(中国知网),会漏掉部分知网没有收录的期刊,所以图示中的文献数据并不能代表该年份发表论文的最高统计值;其二,由于数据清洗带有一定的主观性,有可能因为疏忽而漏掉有统计价值的文献。基于本次检索对象的数据量偏小且主题集中等特点,因而可以忽略不计这些微小影响因素。
2文献分布规律及主题分类
2.1文献年度分布情况
从文献年度数量分布图(图1)可知,IR研究主要分为两个时期,2004年至2010年为增长期,文献数量从2004年的1篇迅速增至2010年的54篇并到达最高峰,随后文献数量萎缩至2013年的12篇。由于2013年的数据量只统计到了当年的7月份,如果按照一般规律推算,全年的数据量将超过20篇,以2010年作为对称轴将曲线展开,2009年和2011年的文献数量相差不大,数量为48±1,再各自增减一年,2008年和2012年的数据量分布情况类似于前者,照此规律推测,2013年的数据量将在20左右,是一个衰落期的缓冲时点,类似于2007年在增长期的角色。随着国家社科基金项目和其他资助项目的不断推进,机构知识库的研究热度将趋于平缓,主要问题也得到解决,接下来将是理论与实践的融合期,并以此为研究的重点,查漏补缺是科研创新的一个重要方面,在IR研究中也同样适用。
图1机构知识库研究文献年度数量分布图
2.2载文期刊分布情况
将检索结果导入Excel中统计期刊分布情况如表1所示,具体情况分析如下:(1)259篇IR研究文献分布在30个不同期刊,期刊共分为8大类,其中载文量为1篇的期刊有5个,占总数的16.67%,图书情报类期刊数量最多且发文量也最大,所属期刊数量占总数的63.33%,所发文章数量占总数的93.82%;(2)发文量大于5篇的期刊均为图书情报类,有5类期刊仅刊发了1篇文章,且每类期刊仅含一个杂志,属于IR研究的边缘刊物,说明国内IR研究的重要群体分布在图书情报界。(3)载文量最大的期刊是《图书情报工作》(JA,37篇),其次是《情报杂志》(JB,21篇)和《图书馆学研究》(JC,18篇),需要说明的是JA和JC都是半月刊,JB是月刊,同属CSSCI(含扩展板)来源期刊,发文周期较快,能够及时地传播IR研究的最新动态信息。(4)发文量≥10篇的期刊有13个,《中国教育信息化》刊文量为5篇,占非图情类期刊发文量总数的37.5%,CSSCI来源期刊(C刊)共有9个,全国中文核心期刊(PKU)有21个,分别占总数的30%和70%,C刊和PKU各发表论文245篇和14篇,分别占总数的94.59%和5.41%,说明IR研究文献质量普遍较高。
表1 机构知识库研究文献期刊分布表
2.3文献主题的规整及分类
对所有文献的关键词进行标准化处理,主题词的确定标准是将相同或近似含义的关键词重新规整为一类,并将较长的复合词汇拆分,同时剔除类如 “分析”“现状”“问题”等非关联关键词。处理后的主题词及词频分布详见表2,括号内数字为词频。
表2机构知识库研究文献主题分布表
注:将“数据模型”归入“数据标准与系统平台”主题,而“能力成熟度模型”归入“指标体系与评估评价”主题,部分频次为1的关键词含义表述不清或过于宽泛(如“比较”“学者”等),这类词汇没有统计在内。
为了便于读者理解和分析,需要对部分操作方法进行说明,具体筛选过程如下。
(1)将“机构知识库”(162)、“机构库”(47)、“机构仓储”(24)、“IR”(13)、“机构典藏”(9)、“机构典藏库”(6)、“知识库”(5)、“学术机构知识库”(3)、“联合机构仓储”、“高校机构知识库”、“数字仓储”(2)以及“OpenIR”、“学术典藏库”(1)等词汇归入“机构知识库”主题,由于本文检索对象是IR,因此,IR不能作为独立的主题内容。
(2)将同义词“开放存取”(43)和“开放获取”(32)合并为“开放存取”主题。
(3)版权协议与政策规范是一个重要的主题内容,属于IR建设和运营过程中相对于系统平台的“软环境”。
(4)“美国”(2)、“日本”(4)、“德国”(1)、“印度”(1)等国家以及“台湾”(5)、“台湾地区”(4)、“香港”(2)和“港台”(1)等地区是涉及面较广的词汇,所属文章的内容具有多样化特点,不能单一地将这类词汇汇入某一主题。
(5)频次为1的关键词占总量的78.83%,频次大于10的关键词有8个,其中排名Top5的关键词均为IR或OA,说明IR的建设和运行与OA运动密切相关。含有“图书馆”的关键词总频次为35,在所有关键词中处于高频词,说明IR与图书馆有较强的关联度。“版权”“著作权”和“知识产权”也是高频词,说明IR政策法规研究也是重点。
3文献主题内容分类述评
3.1版权协议与政策规范
IR建设和运行中的版权处理问题引起了学者们的重视,积攒了较多的理论成果,但案例分析偏少且对策建议的针对性较弱,国外的先进经验为我国IR的制度优化提供了良好的借鉴意义。柳菁[3]从政府强制开放存取、开放源代码软件和知识共享许可协议(CC协议)三个主要实践方式引介了美国处理IR版权问题的做法,包括国立卫生研究院(NIH)、治疗中心法案(CURES)以及联邦研究公共存取法案(FRPAA)等机构或法案的强制性OA政策,她认为美国的IR版权政策对我国的有益启示主要有5点:①注重IR建设中利益相关者的权利义务协调与平衡;②健全政府主导的产权管理规范;③坚持面向开放共享的“合理使用”原则;④鼓励开放存取以支持IR的可持续发展;⑤制定因地适宜的CC协议以降低版权侵权风险和运行成本。面向开放式公益服务的IR在资源建设、服务和管理过程中很容易引起资源内容与软件技术使用方面的版权侵权风险,而且这种风险形势日益严峻,已经成为影响IR可持续运行的现实问题。李彩萍[4]介绍了美国、澳大利亚和欧盟关于数字作品传播的版权法规,对比了开源软件(如Eprints构建工具)和商业软件使用所带来的潜在风险,她认为IR的版权风险控制应从政策和协议两个层面展开:①要加强IR版权政策的研究和指导,引导商业出版机构作出政策调整以适应新环境的需求;②应加大存储许可协议、版权转让协议和知识共享协议的管理力度,为了提高科研数据的开放水平并提高知识创新的效果,IR知识资源利用中的版权风险控制应建立在合理使用原则的基础上,加强用户权限管理,并鼓励有条件的机构采取OA政策及其对应的出版模式。
随着开放存取运动的进一步深入发展,著作权问题已成为影响IR构建与服务的重要因素之一。李晨英和杨国栋等[5]从定义、内容、版式、著作权和IR利用许可等五大要素对比分析了作者版本和出版发行版本等两种类型的联系和区别,指出目前版权政策主要有“允许自存档、提供免费阅读和倡导开放存取”等三种形态,他们根据本校的实践效果,在IR处理期刊论文著作权问题中逐渐形成了“尊重著作权、合理收集与利用以及个性化研究”的原则和“在元数据及其内容中明示版权特征”的处理方法。张晓林、张冬荣、李麟等[6]认为依据《著作权法》和投资获利的正当性,公共机构可依法并应该保证享有所保存知识成果的著作权利,在总结归纳15份来自不同国家、地区或机构的政策法规基础上,他们提出了IR内容存缴与利用的权益管理机制:①设定一系列的条件与限制以界定知识成果使用中的权利义务关系;②为了避免限制措施带来的冲突和误解,应实施针对性的利益平衡策略;③应实施促进传播的广度和增值服务的深度以及机构学术影响力等正面强化措施,实施保护作品完整性,促进作品的正确使用以及加强主体责任意识等负面消减措施;④从政策支撑、服务支撑和环境支撑三个方面加强权益博弈和风险管理以提高知识资产保护和开发的科学性。
3.2数据标准与系统平台
IR是一种旨在促进知识传播和共享的数字化资源管理平台。目前可见的系统平台至少有10种,常见的是DSpace、EPrints和Fedora等,它们所要解决的问题基本一致,但体系结构却各不相同,元数据标准和规范也存在差异,因此IR之间的互操作就成为一个阻碍数据共享的障碍。OAI-ORE是为解决分布式数据交换而制定的规范,它也是基于Web架构的独立性抽象数据模型,对于解决分布式IR之间的互操作问题有重要意义。陈晓凤和张志平等[7]选择DSpace系统平台以实现ORE数据模型与DSpace架构之间的映射、资源图的URI发布以及数字资源的收割,展示了OAI-ORE在IR中实现复合数字资源的知识表示以及库间互操作等业务范畴内的积极作用。关联数据(Linked Data)一般采用RDF(资源描述框架)建构数据模型,利用URI(统一资源标示符)定义数据实体,并通过HTTP协议浏览并获取数据,是实现Web数据共享的一种常用方法。徐华[8]认为关联数据经由关联规则映射后输入至知识环境中实现IR知识服务,利用汉化版的Dspace软件构建基于关联数据(关联规则)的外部协作系统以实现个性化的检索、定制和推送服务。王思丽和祝忠明[9]认为选择适当的关联数据源,利用RDF进行知识呈现、语义标注和关联映射,以CASIR为应用平台,实现IR的语义拓展。关键技术包括实体关系的语义揭示、数字对象的知识组织以及实体数据语义标注等核心方法。拓展模块的实现步骤包括实体关系的抽取和添加约束规则、语义标注和关联以及模块测试和运行等流程。经过实验表明基于语义扩展的IR比传统IR在内容和资源组织方式上更具优势,为CASIR实现从基础服务到集成服务的转型提供了技术支撑和运行环境。
具有优势的IR联盟也有现实问题:同一IR内的资源访问权限,不同IR用户的角色转换和身份认证,跨机构的认证技术和授权方案都成为知识资源共享的障碍,其中既有制度因素,也有技术因素。常用的访问控制和授权技术包括:①IP限制、账户密码保护和个人凭证等认证方法;②自主访问控制(DAC)、强制访问控制(MAC)和基于角色的访问控制(RBAC)等访问控制模式,其中RBAC是目前应用最广泛的策略;③Web Proxy、Kerberos、PKI和SMAL在内的单点登录(SSO)用户管理机制。马建霞[10]比较分析了10个不同国家的认证联盟,其中对IR联盟跨库认证和授权最有适应性的是基于SAML和XML Schema的体系结构和策略框架以及开源软件的Shibboleth项目。Shibboleth2.0架构主要由身份提供者(Identity Provider)、服务提供者(Service Provider)、WAYF服务和Shibboleth访问控制等流程和机制组成,它具有易于实现跨库访问管理、良好的安全性和可扩展性、细粒度和分布式的访问管理控制、丰富的资源支持以及易于移动访问等特点。国外的IR联盟在跨库认证方面作出了有益尝试,她认为基于SAML开放标准的Shibboleth在IR访问控制方面具有可靠的应用前景。
Dspace是基于Web服务的易用平台。中科院国科图兰州分馆从2006年起开始基于Dspace系统进行主题学科的机构知识库平台(CAS-IR)建设和应用,拓展开发的原则是保持固有分层封装和调用机制的完整性和可维护性,同时设置IP访问权限和API功能模块。祝忠明和马建霞等[11]设计了基于“JSP+Servlet”的WebUI工作机制,功能模块包括:①涵盖内容描述、文件上传、信息检查和应用许可的提交步骤及工作流程;②涵盖内容转换、批量导入以及可视化选择和映射的数据导入模块;③基于学科主题分类树和内容类型的扩展性浏览/检索功能,以及包括数据收藏、交换、利用统计、关联检索、书签收藏和引用方式在内的系列延伸服务;④包括访问利用统计和资产状况审计在内的知识资产审计功能模块;⑤用户管理模块包括用户注册的识别、权限分配以及文件的解析处理等;⑥SRU检索服务接口采用OCLC开发的SRW/U开源软件工具包,同时还对用户界面的优化提出改进意见。Dspace的“应用层→业务逻辑层→存储层”分层架构设计具有良好的拓展性能,具有集成化优势的开源软件包提高了数字资源利用的效果和效率,参数化配置设计提高了IR的灵活性,协同开发环境也为IR的合作开发进程提供了制度基础。
3.3组织结构与模式模型
韩国dCollection(DC)机构库是典型的全国性共建共享模式,DC体系结构由数据供给系统(DPS)、OAI-PMH协议和服务供给系统(SPS)等构成,建设IR能丰富和优化本馆信息资源,为资源共享提供基础。孟祥保[12]认为我国的IR建设应借鉴区域性图书馆联盟的建设模式为IR提供逻辑参考框架,机构库联盟将成为未来发展的主要趋势,分布式的开放存取平台将是数字整合服务的最佳选择。陈淑珍和韩珂等[13]从IR总体组织建设和推进的角度总结出国外IR的主要模式:①由图书馆或信息中心发起和参与并将IR服务推广至整个机构层面的自下而上模式(M1),其建设主体是高校或科研机构,如麻省理工大学(MIT)的DSpace@MIT项目和加利福尼亚大学(UC)的eScholarship项目,M1模式具有速度快、宣传广和覆盖面广等优势,同时也具有缺乏决策层支持、执行不力和人员认同率较低等发展困境;②由机构决策层和管理层规划、部署并推动的自上而下模式(M2),但M2模式与M1模式具有同样的建设主体,M2具有人财物的有力保障、资源得到统筹协调等优势,这种内在优势将促进政策执行,是具有潜在发展前景的IR组织模式。他们在分析国外的建设现状和国内的现实环境基础上,认为我国宜采用M2模式,具体的实施步骤与策略包括:争取上级支持、组建工作团队、确定建设目标,制定标准规范、设计服务功能、构建技术平台以及加大服务推广等。
台湾学术机构典藏(TAIR)是一种典型的IR联盟建设模式,即按照学科或地缘的关系,通过充分的调研和规划并选择合作伙伴,按照既定政策方针构建IR联盟,可以扩大知识成果的传播、共享及利用,提高机构的学术影响力及地位。傅晔[14]梳理TAIR特点,认为TAIR采取的是“自上而下”的构建策略,因此容易获得上级主管部门的支持和认可,她提出构建省域级高校IR联盟的建议,相应的措施或战略包括:①争取各级部门的重视和支持以保障人财物的建设需求;②搭建跨库检索平台,提高信息资源利用效率,如采取“中心+分机构+参与机构”的组织模式和“分布存储、集中呈现”的服务方式;③设置著作权指南和FAQ(常见问题)栏目,签订许可协议以避免产权纠纷;④采取“自上而下”的强制性存缴制度。从长远发展角度来看,设立讲解讲座课堂,加大推广宣传力度,能够增进公众对IR的认可度。
王颖洁[15]认为我国IR建设模式不能照搬国外经验,而应从人文环境、管理体制和知识产权等实际问题出发,构建一个面向现实国情的特色IR模式,包括以下几个方面:①以促进学术交流、知识共享与创新为建设目标;②以高校的科研机构为主要实施对象,以高校自有资金和政府拨款为财力支撑;③以Dspace的组织结构、Eprints的主题划分以及Fedora的拓展性分层模式为样板,根据具体需求进行改进和变革;④以联盟项目为组织方式并由上级主管部门进行业务指导以及由承担机构负责具体实施;⑤突破出版商对作品知识产权的绝对控制,同时加大宣传力度并获得上级部门的支持和本单位职员的拥护;⑥构建基于OAI-PMH 协议的收割式服务模式,她以某大学为例,对IR应用流程进行设计,即包括内容建设、数据处理与保存、资源共享以及检索使用等四大流程,认为我国IR建设的趋势是在不断普及化的过程中实现协作化的区域性联盟发展。依据当前的国情,我国电子出版物呈缴制度尚处于完善阶段,各方面条件都不成熟,吴有梅[16]认为“呈缴模式+激励政策”是目前最佳方式,其中呈缴模式可以根据具体情况采取多样化策略,如强制性的法定呈缴,主动性的协议呈缴等。呈缴模式属于IR建设的配套设施,应在资源获取、财务支持以及技术保障等方面加大力度。国外一些大学利用Dspace 系统模型构建了数字资源社区,这种模式为大学机构库的建设提供了良好的示范作用。IR的建设和运行是一个涉及多部门协作的管理活动,宛玲和苏娜等[17]认为应将所有关联部门纳入整体性框架中并实现职责分工,但不应过于依赖组织的主动协调,因此需要构建跨部门协作管理模式以增强IR运行的灵活性和机动性,同时还应保持与外部信息环境的交换与整合。
3.4指标体系与评估评价
数据质量是用户访问IR数字资源时最关注的要素,也是评价IR建设成效的关键。元数据是对信息资源内在特征和属性的结构化描述,为各种形态的数据集提供规范化的检索方法,但是随着IR存储量的指数级增长,建立元数据的传统方法已经无法保证其质量和效率,自动化处理方式是必然选择。元数据提取(Metadata Extraction)和元数据收割(Metadata Harvesting)是常用的元数据自动生成办法。在IR的构建过程中,自动生成元数据速度快、效率高且成本低,但能否在检索中准确匹配和应用则取决于元数据质量。为了便于实际应用,林爱群[18]认为应建立一整套元数据质量评估和评价体系,即基于Gasser and Stvilia框架体系以及Bruce and Hillman框架体系的框架指标,包括元数据(加权)完整性和元数据精确性等两项重要指标,以及期望一致性、逻辑一致性、可达性和时效性等一般性指标,共同构成一个完整全面的元数据质量评估体系。
自存储是IR容量积累的重要方法,也是评价IR效果的组成部分。现有的自存储评价暴露出作品创作者权属不清和文档内容调查较少等缺陷。郭清蓉[19]认为自存储评价指标应集中于文档数量和质量方面,影响自存储评价的因素包括存储者信任、存储数量、全文可获得性、创造者态度、每次存储费用、可用性、互操作性以及版权、质量控制、利益相关者态度和软件系统等。评价体系包括IR内外部评价、经济评价和技术评价等4个一级指标,7个二级指标和16个具体指标。评价体系的构建从侧面反映出社会公众对IR的期盼和要求,但同时也需要在实践中不断调整和改良。邓君和韩毅[20]认为IR内容建设方面还受到固有传统文化和法律保障因素的影响。除此之外,还受到技术、标准和其它因素的影响,应继续深入探寻这些影响因素的内在根源并据此提出针对性的改进意见和可操作性的应用方案。
可用性是IR建设初期软件系统评估的一个重要质量指标,对用户而言,可用性涉及系统的性能、流程和效果,对操作人员而言,可用性是系统存在的前提条件和运行基础并关系着系统开发的成败,因此,对构建IR的各类软件可用性进行评估,对提高质量、优化性能、提升影响力和促进可持续性发展有着积极意义。洪梅和马建霞[21]认为IR软件的可用性评价指标包括有效(Effectiveness)、交互效率(Efficiency)和用户满意度(Ssatisfaction)三大维度。通过对国外6所大学的开源IR软件可用性评估的案例分析,构建了两类可用性评估方法:①没有用户参与的评估方法,包括对比评价、认知走查法(CW)和启发式评估(HE)等三种典型方法;②有用户参与的评估方法,包括选择代表性用户、设计测试任务、确定测试地点、记录数据和分析结果等五个主要环节。金瑛[22]从内因和外因两个方面归纳总结了国外IR存储行为影响因素,内因主要包括对IR的基本认识和价值把握、学科文化理论及存储经历、对存储内容质量及产权的信任;外因包括数据转换、系统架构和容量扩展等技术问题,强制性政策、鼓励政策和联系制度等存储政策,先导性项目的示范作用等。她认为探索更多的影响因素并构建科学合理的IR存储模式是未来一段时间内的研究重点。
4结语
机构知识库的建设和运行是一项涉及多方面利益关系的系统性工程,需要在长期的探索中不断优化和完善。经过对近十年来IR研究现状的归纳总结,主要发现以下几个问题:①国内最欠缺的不是技术而是面向本土化科研语境的制度规范,学者们的研究重点多在展示国外的IR制度形态,对国内IR运行的版权(产权)归属问题的阐述和解释无关痛痒,这是目前软环境建设亟待面对的现实问题,知识产权(尤其是数字资源)保护和规范仍是一个复杂问题;②国内IR建设的技术架构、数据标准和系统平台初见端倪,部分学术机构已经在积极构建面向本领域或本单位的自有机构知识库,而忽略了整个科研体系内的数据资源共享,“各自为政”的现象依然存在,同时IR内容容量较小且获取程序不够人性化,技术已经上位,但服务却失位;③一个健康可持续发展的IR需要进行科学的评估和评价,国内相关研究处于起步阶段,各种评价标准仍过于粗放和宽泛,针对性的评估体系尚未完成,这是IR建设的保障机制也是长期发展的制度环境,这方面工作亟待加强和改进,同时还应注意重复建设和资源浪费问题,短期内实现区域性IR联盟协作仍有一定难度,利益分配和权责定位仍是主要障碍。
参考文献:
[ 1 ]Raym Crow.The Case for Institutional Repositories: A SPARC Position Paper[EB/OL].[2013-09-17].http://scholarship.utm.edu/20/1/SPARC_102.pdf.
[ 2 ]Directory of Open Access Repositories. Search or Browse for Repositories[EB/OL].[2013-09-13].http://www.opendoar.org/find.php?format=charts.
[ 3 ]柳菁.美国机构知识库版权问题的解决方式及启示[J].情报科学,2013(5):157-160.
[ 4 ]李彩萍.论机构知识库的版权风险及其控制方式[J].图书馆理论与实践,2013(7):31-34.
[ 5 ]李晨英,杨国栋,臧琳,等.机构知识库收录期刊论文涉及著作权问题的解决途径探讨[J].大学图书馆学报,2010(1):74-79.
[ 6 ]张晓林,张冬荣,李麟,等.机构知识库内容保存与传播权利管理[J].中国图书馆学报,2012(7):46-54.
[ 7 ]陈晓凤,张志平,白海燕.OAI-ORE在机构知识库中的应用研究与实现[J].现代图书情报技术,2010(11):69-74.
[ 8 ]徐华.基于Dspace和关联数据的机构知识库合作服务模式构建研究[J].情报科学,2012(7):1021-1024.
[ 9 ]王思丽,祝忠明.利用关联数据实现机构知识库的语义扩展研究[J].现代图书情报技术,2011(11):17-23.
[10]马建霞.机构知识库联盟的认证和授权的技术机制分析[J].图书情报知识,2010(4):90-95.
[11]祝忠明,马建霞,卢利农.机构知识库开源软件DSpace的扩展开发与应用[J].现代图书情报技术,2009(7/8):11-17.
[12]孟祥保.韩国机构库建设模式研究:以dCollection为例[J].图书馆杂志,2009,28(12):59-62.
[13]陈淑珍,韩珂,祝忠明.我国大学机构知识库建设的模式选择与实施策略[J].图书馆杂志,2009(8):52-54,77.
[14]傅晔.TAIR对我国大陆高校机构知识库建设的启示[J].图书馆工作与研究,2011(12):78-81.
[15]王颖洁.我国机构知识库模式构建与流程设计[J].图书情报工作,2008,52(4):104-107.
[16]吴有梅.论机构知识库建设中的呈缴模式[J].图书馆理论与实践,2010(3):33-36.
[17]宛玲,苏娜,厉志红.大学机构知识库组织管理问题研究[J].图书情报工作,2008(4):97-99.
[18]林爱群.机构知识库元数据的自动生成与评估研究[J],图书馆学研究,2009(7):10,21-23.
[19]郭清蓉.机构知识库自存储评价体系的构建[J].情报杂志,2009,28(7):73,74-76.
[20]邓君,韩毅.机构知识库发展的文化法律影响因素研究[J].情报科学,2008(6):918-923.
[21]洪梅,马建霞.开源机构库软件可用性评估方法的探讨[J].现代图书情报技术,2007(12):6-10.
[22]金瑛.机构仓储存储行为影响因素研究述评[J].图书馆建设,2010(4):14-17.
王晴 山西大学经济与管理学院2011级情报学硕士研究生。山西太原,030006。