基于中文名称规范档的人物信息聚合研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:oncecao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
名称规范的管理是图书馆机构规范控制的主要工作,在2003年我国内地及港澳台的多家机构联合建立了中文名称规范联合数据库,针对数据库资源的检索和查询,为用户提供了中文名称规范一站式查询系统。不同机构对名称规范档中数据资源的管理缺乏统一的整合方法,导致共享性较差;而且数据来源比较单一,主要为书目数据,降低了数据库名称资源的服务水平和信息质量。人物作为客观世界最为重要的实体,其相关的数据资源在中文名称规范档中冗余程度较高,同一人物的多条标目缺乏语义关联和信息整合。通过构建人物关联模型,完成人物实体的信息聚合,进而提高图书馆特有资源的数据质量具有重要意义。当前,国内外众多知识库均覆盖了人物、组织、会议等多类型的实体数据,各知识库对实体对象的构造方式、描述属性和语义关联都各有特点,且大多知识库都是基于开放和关联的。中文名称规范档的人物实体属性匮乏,存储格式难以关联和优化,信息聚合成为解决上述问题的有效途径,既能整合国内多家机构的重复条目,进而识别同一实体,又能与其他不同类型的数据库建立链接,形成属性丰富的人物关联模型,满足多元的知识服务和需求。本文基于中文名称规范档的人物信息聚合问题进行了理论探讨和实证研究,主要从以下几个方面来展开:(1)分析国内名称规范档多机构数据聚合存在的问题,针对数据库人物条目分散重复的情况,提出了基于无监督学习的人物聚类方法,对国内规范档人物实体数据进行初步整合。(2)在整合国内各机构规范标目的基础上,探索与虚拟国际规范档的人物匹配方式,分析世界各地相关机构对规范名称的贡献数量和匹配方法,设计国内外两库人物的实体链接实验,评估人物实体根据名称及属性匹配的有效程度,为实现国内规范档与国际接轨和数据共享建立基础。(3)分析维基数据中人物实体的属性框架,利用向量空间模型测量与中文名称规范联合数据库的人物相似度,根据人物关联模型进行信息聚合,按照语义网的数据规范,将其发布为关联数据,扩展规范名称资源的利用方式,克服异构障碍,进一步实现图书馆信息资源的共享和利用。
其他文献
为研究无缝桥面伸缩缝结构的使用性能,对3类伸缩缝结构(无缝桥面伸缩缝结构、混凝土-弹塑体伸缩缝、沥青混凝土-弹塑体伸缩缝)进行室内模型试验,通过分析结构的伸缩性能以及
随着新一代信息技术的迅速出现,给经济发展提供了新的动力引擎后,IBM公司于2009年提出了“智慧城市”这一理念,这一理念意在利用物联网、云计算等技术来提升城市管理水平、满
梁肃是唐代古文运动中承上启下的重要作家。梁肃主张宗经明道,文质并重,情采并重,道气辞相兼,坚持文章以"道"为本,但不否定文章本身的价值,能辩证地看文质关系。其文质思想较
<正> 机械结构中,壳体孔与滚动轴承外环的配合经常因磨损出现微量间隙,使轴承外环与安装孔产生不应有的相对转动。这时,若不及时修复,就会导致恶性发展,使整台机器精度下降,
体育教学是高等教育的重要组成部分,在实际的体育教学过程中合理和科学的运用体育游戏能够有效提高教学的质量。体育游戏本身叫做游戏,其本质也是一种体育运动。本文通过体育
<正>身高172,体重110多斤,在图书馆前见到杜昊滢,记者有些意外,这个高挑、白皙、笑容温和的大三女生,是2014年第一届世界太极拳锦标赛之女子陈氏太极拳的冠军。事实上,身为专
自1840年鸦片战争的炮火敲开了中国的大门,包括西方音乐在内的各式西方思想和文化艺术涌入中国,强烈地冲击着这个古老国度历经千年的传统。自“五四”运动之后关于中西方音乐
美育作为中国现代美学理论中的重要思想,在中国现代思想发展史中具有重要地位。启蒙民思、重构精神、振兴中华成为了现代中国美育理论建构的目的。在春秋时期,已有通过“诗”
实现语文课程教学工具性与人文性的高度统一,是构筑新语文课程教学的理想方向。过分强调工具性,会使我们的语文课堂机械而乏味;过分地强调人文性,又会使我们的语文教学空洞而
通过对比试验和现场实践,总结出了大倾角较薄厚煤层综采放顶煤的采放比、放煤步距、放煤顺序、支架稳定性控制、初采及末采等关键技术。