特定领域实体属性关系抽取方法研究

来源 :昆明理工大学 | 被引量 : 5次 | 上传用户:ynsyxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体关系抽取是信息抽取的重要部分,它能够识别出实体之间的语义关系,作为语义网的基础,实体关系抽取被广泛应用在自动问答系统,信息检索,机器翻译等领域。关系抽取还是构建知识图谱的重要基础,随着万维网转变成语义网,知识图谱的构建变得尤为重要。领域实体间的属性关系是构建知识图谱的重要组成部分之一。对特定领域而言,领域实体属性关系对表达实体之间的语义关系有着重要的意义。本文主要针对中文领域的实体属性关系抽取,作了以下工作:(1)基于Distant Supervision(距离监督)的领域实体属性关系抽取方法,基于领域知识库和相关文本集来获取实体属性关系。关系类型为:景点-实例-属性值。针对旅游领域中的“景点”这个类型,抽取出与“景点”这个类型相关属性,如门票价格、面积等等。距离监督就是通过将知识库映射到文本集中实现关系抽取的过程,即如果一个实体对出现在知识库中,则将文本集中包含这两个实体的句子全部抽取出来,从这些句子中提取特征,训练分类器。本文首先构建一个小型的中文旅游领域知识库,在知识库中预先定义好属性关系和关系实例,并用这个知识库对应地从百度百科或维基百科网页上爬取得到的文本集。本文使用多种特征以提高分类器的性能,提高分类的性能。(2)基于卷积神经网络的领域实体属性关系抽取方法研究。本文提出基于卷积神经网络对领域实体属性关系进行抽取,其中属性关系类型为实例-属性、属性-属性值、实例-属性值。利用卷积神经网络的自动学习表征领域实体属性关系的句法特征、层级特征以及实体所在句子的文本特征,形成特征向量,加入到卷积神经网络中,训练实体属性关系分类模型。实验结果表明,所提出的方法能有效提高实体属性关系抽取性能。
其他文献
随着信息全球化不断发展的今天,广播电视节目已然成为人们日常生活中必不可缺的一部分,传统的电视台影像资料管理模式主要依赖于人工,人工检索资料费时、费力,且工作效率不高
国有企业长效稳定发展离不开监督,而作为主要监督力量的企业内部各监督部门则由于种种原因,总显得监督力量不足,难以确保监督效果,所以需要整合监督资源,形成监督合力。
近两年来,互联网金融在国内呈爆炸式增长态势,互联网企业向金融行业的渗透通过存贷款分流等方式给商业银行经营带来更大的竞争压力。本文采用SWOT分析方法,详细分析了商业银
防守反击技术是散打技术中的一个重要组成部分,探讨防守反击技术的形成、运用及反击战术意识的培养、运用,有助于广大公安干警重视防守反击技术的训练,并在散打实战中加以有
燃煤电厂排放的氮氧化物控制措施包括低氮燃烧和烟气脱硝。氨选择性催化还原是减少NOx排放行之有效的办法,具有脱硝效率高、氨逃逸率低等特点,是燃煤电站锅炉烟气脱硝的主流
<正>"双基"共建农村信用工程,通过加强基层农村信用社和基层党组织(简称"双基")的深度合作,充分发挥协调联动的共建优势,以发展普惠金融为核心,以金融夜校和小额信用贷款为抓
BEPS(税基侵蚀与利润转移)行动计划是由G20委托经济合作与发展组织(OECD)推动的国际税收改革,主要目的在于通过协调各国税制,修订税收协定和转让定价国际规则,来应对跨国企业
矮塔斜拉桥是一种以斜拉索、主梁及桥塔为主要受力构件的组合体系结构,其特点是桥面体系以主梁受弯、支承体系以斜拉索受拉及桥塔受压为主。作用在桥面上的外荷载,大部分由主
新的高考方案体现出改革的目标重心已经从知识测度转向了素质考查。但是,新方案中科目选考制度能否修复文理分科造成的知识断裂,综合素质评价制度是否能真正实现对学生的素质
随着社会经济的不断发展,在我国很多地区的高中已经广泛采用了多媒体教学的方法。但如何有效的利用多媒体手段来激发学生的兴趣,调动学生对于课堂的热情仍旧是需要进一步去探