中文名称规范档与维基百科的资源整合研究

来源 :山西大学 | 被引量 : 2次 | 上传用户:toelfdd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2003年,由NLC、CCS、CALIS、JULAC-HKCAN联合发起并成立了中文名称规范联合协调委员会CCCNA,在委员会的统一协调下,两岸四地的图书馆名称规范数据进行集中存储,并建立了一站式检索平台。但是该平台仅实现了数据层面的整合,解决的是名称规范资源分散保存的问题,在集中存储后,出现了名称规范记录的技术标准形态异构与资源内容的重复建设的问题。技术标准形态异构导致中文名称规范数据的开放程度仍然局限在图书馆内部,不能与网络资源进行有效的交互;资源内容重复建设导致中文名称规范档开始出现同一个体的不同名称标识,不同个体的同名冲突,名称标识的变动以及在跨系统交流过程中名称格式不规范的问题,最终无法满足用户信息检索的需求。世界上最大的、影响范围最广的网络百科全书——维基百科,其中文版拥有811305个条目,人物类(信息盒中的字段数大于3)条目已经超过8000个,条目内容极其丰富,以传记的形式详细描述了人物的生平信息,并采用结构化的信息盒对该人物的属性进行结构化的描述。维基百科资源可以对中文名称规范档形成有效的补充,帮助解决目前中文名称规范档存在上述问题。  本文在国内外名称规范数据发展建设、名称规范数据的资源整合,以及名称规范数据与网络资源的整合研究的基础上,分析了国内现有的 CCCNA数据库检索系统的资源使用情况,论述网络资源中维基百科作为目标整合资源的优势,以及中文名称规范数据与维基百科整合的必要性。提出中文名称规范档在数据整合的基础上,可以与维基百科做进一步信息整合,甚至是语义整合。  在信息资源整合方面,首先对实现信息整合的方法做出分析,然后重点论述了维基的接口MediaWiki API,并利用该接口实现中文名称规范档与维基的信息资源整合:自动生成将维基条目的链接和该条目的简介,然后将此添加到中文名称规范档相应的记录中。最后对集成结果和实验效果进行评估。  在语义整合方面,本文采用综合归纳及比较研究的方法,总结 Wikidata的发展历程,对其数据特点及数据模型进行研究。Wikidata具有开放、协作、多语言、结构化的特点,其以条目为核心,定义了实体类及属性,提供了多样化数据获取方式。然后针对中文名称规范档的数据组织现状设计中文名称规范档与 Wikidata的语义整合模型。在语义整合的实现上,本文采用关联数据技术的方法,首先将中文名称规范档的数据进行语义化,并下载了Wikidata中的人物数据,在此基础上,使用PARIS算法,实现了语义化的中文名称规范档与 Wikidata的实体对齐,最后对实体对齐的结果采用数据可视化的方式进行展示。
其他文献
[目的/意义]公共图书馆总分馆空间分布和地理覆盖对实现公共图书馆全覆盖和均等化具有重要意义。[方法/过程]在对公共图书馆总分馆空间分布和地理覆盖的"全覆盖"和"均等化"阐释的基础上,运用GIS工具,以苏州为例计算并分析苏州公共图书馆总分馆的空间分布和地理覆盖状况,以此规划今后总分馆的布局。[结果/结论]测算公共图书馆总分馆动态服务荷载和服务半径,可以有效揭示公共图书馆总分馆布局的盲区,确定优先建设
[目的/意义]距离是影响用户到访公共图书馆的重要因素。公共图书馆可达性是衡量一个城市公共图书馆布局合理性和科学性、全覆盖和均等化的考量。[方法/过程]以可达性理论为基础,探讨对公共图书馆服务区域测定的不同方法,辨析空间可达性概念与指标。利用ArcGIS,以苏州工业园区为实例,对公共图书馆总分馆网络空间可达性和服务区域进行实测,测评直线距离和实际路径距离、泰森多边形框定服务区域和公共服务保障圈。[结
在教育方式不断发展和完善的今天,需要对传统的教育模式的诸多弊端做出修改,生本教育理念下的高效课堂就是新时代的教育理念,在传统的教学模式下,往往是老师单方面的热情高涨
[目的/意义]识别和分析图书馆在当前变革环境中实现发展的动力作用机制,解释其变化规律和作用方向.[方法/过程]对已有研究进行回顾,借鉴组织理论和知识理论构建分析框架.[结
随着知识经济和经济全球化的深入发展,高层次人才成为世界性稀缺资源而倍受各国关注。我国的“长江学者奖励计划”和加拿大的“加拿大首席研究员计划”都是为帮助本国的大学吸
在国家新时代生态文明建设新布局和新要求下,生态环境和地质环境更加紧密的成为地质勘查工作的前提和基础.综合考虑青海省生态环境、地质背景和赋煤特征,按照自然地理、气候
近些年来,随着公民的信息权利意识不断增强,无论是利用档案维护自身权益还是休闲娱乐的需求都在不断增长。因此,公众对档案馆的要求也就越来越高,档案馆形象成为衡量档案馆绩
2002年汝州市大峪乡耕地浪费10亩。  2005年汝州市大峪乡耕地浪费15亩。  2008年汝州市大峪乡耕地浪费20亩。  近几年来,大峪乡的耕地资源浪费现象日益严重,是什么原因造成了家乡的耕地资源不断浪费呢?经过调查并认真分析了大峪乡的气候、地形特征、耕地类型、经济发展状况及群众的思想意识后,了解到家乡耕地资源浪费的原因主要有以下方面。  山洪冲毁,耕地损失严重。大峪乡是山区乡,山地面积广大,
[目的/意义]通过调查个体从业人员这一群体的阅读需求满足情况,考察基层图书馆阅读服务体系的建设状况.[方法/过程]深度访谈30名个体从业人员并调查周边基层图书馆,分析他们
[目的/意义]公共图书馆地理空间布局影响着读者到馆方式和成本花费,进而影响读者对图书馆访问的体验和频次.[方法/过程]基于出行链理论和场域理论,围绕公共图书馆地理空间布