档案知识图谱构建技术研究

来源 :中国电子科技集团公司电子科学研究院 | 被引量 : 1次 | 上传用户:wzq8013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机信息技术的发展,档案数据的类型由单一的结构化数据变得多样化,档案数据规模也显著增长。本文针对档案知识图谱构建技术进行研究,旨在通过改变档案数据的存储方式和档案资源的使用方式,为档案数字信息化提供一种新的思路。论文依据档案概念模型理论标准,提出采用七步法构建档案本体,分析了档案知识图谱的专业领域范围,同时定义了档案实体类型和实体之间的层级关系。在完成档案本体构建分析之后,论文对档案实体识别模块进行了架构设计,并提出了两种档案实体识别算法来实现档案实体知识的抽取。然后通过实验对两种档案实体识别算法进行了质量评估,得出结论基于LSTM网络的实体识别算法相比基于规则匹配的实体识别算法具有更高的正确率。在完成实体识别工作之后,论文提出采用基于实体词性的关系抽取算法和基于依存句法分析的关系抽取算法对档案实体之间的关系进行抽取。最后通过实验对两种档案关系抽取算法进行了质量评估,得出结论基于依存句法分析的关系抽取算法的正确率要高于基于实体词性的关系抽取算法。为了解决档案知识图谱中知识重复的问题,论文对档案知识融合模块进行了架构设计,并提出通过建立分区索引,减小知识融合的工作量。在论证了属性权重向量的相似度与实体相似度具有相关性之后,作者在此基础上提出了两种成对实体对齐方法,之后进一步分析了集体知识融合技术。并通过实验对四种实体对齐算法进行了质量评估,得出结论成对的实体对齐算法效果优于集体实体对齐算法。本文从本体构建、知识抽取、知识融合三个方面对档案知识图谱构建技术进行了深入研究。后续将继续考虑如何进行档案知识推理,进一步丰富和扩充档案知识图谱。
其他文献
通过采集3个天然种群的金丝李(Garcinia paucinervis)果实,观察果实和种子的形态性状,分析其种群内和种群间的形态分化,观察不同种群种子萌发和幼苗生长的规律;采用四种植物生
论述了零长发射闭锁力、释放机构剪切销尺寸、剪切力计算方法。利用虚拟样机技术(VPT)建立了无人机零长发射分离过程动力学仿真模型,对发射分离各种工况进行仿真分析,得到了无
<正> 在以实现四个现代化为中心任务的新的历史时期,统一战线仍然是实现党的总任务的“一个重要的法宝”。作为我党统一战线政策和民族政策重要组成部分的对少数民族上层人士
通过对重庆农村不同经济收入家庭的能源消费结构及消费指标的调查分析,得出重庆农村家庭能源消费结构与经济收入具有密切的相关性:随着人均收入的提高,农民生活的改善,薪柴、
随着航天技术的不断发展,充气式再入返回技术逐步成为国际上的研究热点。文章以充气式再入返回系统为背景,对柔性热防护结构进行了优化分析。首先,参考美国充气式再入返回试
介绍粘接和密封技术在国产客车制造中应用的范围、特点,客车制造业对粘接密封剂的要求,并详细阐述粘接和密封技术的实际应用。
通过对中西方邀请和回应言语行为进行实证对比分析研究发现,西方邀请具有高度商讨性并以信息传递为中心,而中方邀请则高度公式化并以交际为中心。
旋转机械作为最常见的机械设备,是工业连续化生产的核心部分。当旋转机械出现故障,轻则造成设备损坏、经济损失,重则造成人身伤害甚至伤亡出现。因此旋转机械稳定可靠运行尤为重要,必须时刻了解设备实时运行状况。当设备运行过程中出现异常时需及时分析原因,进行故障诊断。通过运用网络通讯技术、数据库技术、ASP.NET技术和人工智能技术,开发出基于B/S模式的旋转机械故障诊断实验平台,同时研究旋转机械不同故障类型
旨在将基于液相色谱-质谱(LC-MS)的代谢组学分析平台用于研究不同棉籽粕源发酵饲料对鸡血浆代谢物的影响。本研究用LC-MS采集对照组(CG)、假丝酵母组(CT)、酿酒酵母组(SC)和
海南岛的沿海防护林系统具有防台风危害的功能,保护海南的生态安全和经济安全。目前对于海南海防林和沿海地区森林的抗风能力调查的研究很少见。本项目主要是结合调查和实验