中文历史人物亲属关系自动问答研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:xiaofeixiaheiwa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人们对快速、准确获取信息的需求下,搜索引擎和检索方式不断地更新迭代。一方面,伴随着数字化产业的蓬勃发展,产生出了越来越多有待开发的数字资源。另一方面,伴随着自动问答技术的发展,用户已不再满足于关键字匹配的查询,开始寻求更简洁、准确的检索引擎。中国历代人物传记资料库就是数字化产业的冰山一角,如何将数字化的产物倾注智能问答的灵魂,使得合成的产品更好地为用户服务,本文进行了初步的研究与探索。本文研究了推理补全缺失关系的方法,设计并实现了一个基于知识图谱的人物亲属关系自动问答系统,解决了搜索引擎不支持自然语言检索,返回结果不简洁的问题。本文的主要工作如下:第一,研究了知识库表示学习中的翻译模型,通过现有多种翻译模型的对比实验,找出一种合适的知识库表示方法,实现了历史人物亲属关系自动推理,有效解决了中国历代人物传记资料库中人物亲属关系大量缺失的问题。之后对比分析了人物亲属关系推理补全前后的结果,以及产生推理错误可能的原因。第二,改进了翻译模型。翻译模型是将知识库中的实体和关系转化为低维向量的方法。本文在现有翻译模型的基础上,通过改进负采样的方式融合实体特征,使得实体和关系向量在空间上分布更加合理,更加具有表现力,通过实验证明此方法能有效提高关系推理的准确性,其可行性在中国历代人物传记资料数据中得到有效验证。第三,利用改进了的翻译模型方法,设计并实现了一个中文历史人物亲属关系自动问答系统。该系统以中国历代人物传记资料库(CBDB)为语料来源,将存储于access关系型数据库中的中文历史人物亲属关系,转化为通过Neo4j图数据库存储的人物亲属关系知识图谱,便于可视化展示与分析人物关系。针对用户提出的自然语言的问题,本系统利用自然语言处理相关技术生成问题三元组,然后转换为Cypher查询语句在图数据库中查询、或利用人物关系推理返回问题答案。
其他文献
对河流类型进行沉积学分析,将河道体系分为单河道和多河道(或复合河道)体系,顺直河、曲流河和辫状河为单河道体系,而网状河和其他分支河归于多河道体系,单河道一般由细粒漫岸
目的:总结老年人严重药品不良反应的主要表现,为用药安全提供指导。方法:对我院2004年1月~2009年12月诊治的老年人严重药品不良反应(ADR)300例进行统计分析。结果:本组ADR涉及的药品
目的:评价乳牙弥散性根尖周病变根管治疗术的临床效果。方法:常规根管治疗术,碘仿糊剂作为乳牙弥散性根尖周病变的根管充填剂。结果:随着根管治疗术后时间的延长,治疗成功率大大上
建立现代企业制度的三个难题高良谋党的十四届三中全会提出了国有企业建立现代化企业制度的目标。这个目标的确立标志着我国经济体制改革已经进入到了全面转轨的"攻坚"阶段。以
针对现有匹配二进制特征搜索算法效率低和入围点少的问题,提出了快速计算位图算法和位图局部敏感哈希算法。首先,计算左图提取的二进制特征的位向量;然后,使用快速计算位图算
机-相扫描三坐标雷达的天线和天线所在平台一起做摇摆运动,导致雷达波束指向的不稳定。因此,雷达所在平台水平度将严重地影响雷达的跟踪精度。基于边扫描边跟踪(TWS)系统的三
鄱阳湖生态经济区作为国家的战略发展区域,应该具有超前思维,大力发展绿色产业,而资源型产业容易造成外部不经济,因此更需要健康、绿色发展。本文利用AHP方法对环鄱区资源型
1987年10月,比利时萨布卡(SABCA)公司交出改进豹1坦克后的第一辆样车。样车安装萨布卡公司带热红外瞄具的新型火控系统。新型瞄准具能看到像黑白电视机那样的图象。它优于像
主要围绕西北戈壁环境片区化多管沟在土石方开挖爆破中,针对常规开挖爆破方式难度大、管沟位置错层交叉布置、基坑爆破较深开挖量大、与各厂房接口多而复杂、土石方倒运作业
滚动膜片是由橡胶材料制成,具有固定密封的功能,在燃气调压器中十分常见,为了尽量提升滚动膜片的密封性能,必须要对滚动膜片的设计制造相关的问题有充分的认识。本文结合D50直接