大规模知识图谱完善关键算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:sunhaifeng112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着语义万维网数据的不断激增,以图结构作为表示框架的知识图谱成为了当前学术界、工业界的研究热点。知识图谱包含了丰富的结构化信息,存储事实在千万级别以上,覆盖了许多真实的实体与关系,为许多人工智能技术提供了可靠的信息来源和底层支撑,极大的智能化了许多现实应用。然而与现实世界包含的无穷尽的知识相比,知识图谱的完善程度仍然是远远不够的。利用自然语言处理的相关技术,从大量的非结构化和半结构化数据中抽取结构化信息,实现对知识图谱的扩充是行之有效的方法。但是之前的抽取过程需要大量的专家知识设定相关的启发式规则,并且需要大量的人为参与来保证抽取信息质量。近年来,随着人工智能领域特别是机器学习方向的蓬勃发展,研究者们期望利用机器学习算法在现有的存贮事实基础上,进行知识的推理与融合,完成机器自动化扩展知识图谱规模的目标。大规模知识图谱完善任务是自然语言处理领域非常热门的研究方向,同时也是本文的研究目标。本文详细介绍了基于统计关系学习的两大类知识图谱完善算法:基于图特征的路径排序算法;基于隐式特征的知识表示学习算法。路径排序算法利用随机游走的特性可以很好筛选出公共关系路径作为显式特征;知识表示学习在表示学习框架的基础上更加适应知识图谱的内含语义和规模需求。在两者的基础之上,本文提出了一种新颖的关系路径嵌入模型:将包含丰富语义信息的关系路径整合到知识表示学习模型中,通过利用关系与可信赖关系路径的语义相似性,将已有的关系投影和关系约束扩展到新颖的路径投影和路径约束。路径投影使得实体可以同时在不同类型的隐式空间内进行低维的表示学习;路径约束增加了模型在隐式空间里对相似嵌入信息的决策能力。两种新颖的创新可以很轻松的整合到其他的知识表示学习的框架中,获得更优的算法性能。我们在三种公共数据集上对我们提出的关系路径嵌入模型进行了两种标准的任务评测:链路预测和三元组分类。实验结果表明我们的模型要显著优于基准的知识表示学习模型,同时也表明我们的模型可以很好的捕获到关系路径的语义信息。
其他文献
精密玻璃热压成型技术作为一种高效率、低成本、对环境友好、适合批量生产的近净成型工艺,在最近的20年里得到了迅速的发展和广泛的研究。但由于热压成型过程中玻璃材料所受
伊斯兰教传入我国已有1300多年的历史,在与我国传统文化接触和碰撞的过程中,伊斯兰文化被赋予了许多中国传统文化的色彩。从清真寺,到宗教语言、宗教礼仪、宗教用品和穆斯林生活
报纸
深圳市银行业协会乘着改革开放的春风,踏着时代前进的足音,砥砺前行,创新发展,始终以党建引领各项工作,以敢闯敢试、敢为天下先的特区精神,引领行业创新奋进,在打击电信网络诈骗、推
报纸
当前,互联网的发展给人们的生活、工作与学习带来了极大的便利,“互联网+教育”是当前我国教育事业的改革趋势。在当前教育改革持续深化的背景下,所有小学语文一线教职人员都
本文建立并研究了三个生态流行病模型.我们利用Hurwitz判别法、Mawhin′s连续性定理、Lyapunov函数等方法,讨论所研究模型的动力学行为,包括自治系统的平衡点的稳定性,周期非
任何企业发展必定离不开正确的发展方向,为了保障方向正确就离不开管理工作实施到位。根据我国目前企业来看,所有企业管理中,财务管理是最为重要的,财务管理是企业发展的基础
随着社会的发展和时代的进步,国民生活水平不断提高,社会越来越关注学生教育,这在一定程度上促进了教育旅游的发展。当前,我国的在校学生人数极其庞大,形成了潜在的旅游市场
为筛选高效好氧反硝化菌,研究其适宜生长条件及好氧条件下反硝化性能,最终为该菌应用于水源水生物脱氮提供理论依据,采用平板划线、形态学观察、生理生化和16S r DNA序列分析
本文探讨了乾隆三十八年刊行的满汉对音辞书《钦定清汉对音字式》中注音汉字下“平声读”和“入声读”的性质。在查阅多种文献,及对文本十二字头所列的663条单清字进行详细归
随着信息通信技术、无线传感网等的发展,人们置身于无处不在的网络环境中,“泛在”的概念日益凸显,泛在网络将互联网、物联网以及多种网络业务相融合,以其“无所不在”、“无