指代消解的研究与实现

来源 :山西大学 | 被引量 : 0次 | 上传用户：tta86

【摘要】

：

近几年,中文信息处理的发展已经不再局限于简单的事实类问题,研究更多的是言语理解方面的复杂问题,在信息抽取,文本摘要等应用中都用到指代消解,能够准确的进行指代消解,在自

【作者】

：

张倩

【出处】

：

山西大学

【发表日期】

：

2017年01期

【关键词】

：

指代消解 N-Gram 最大熵

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近几年,中文信息处理的发展已经不再局限于简单的事实类问题,研究更多的是言语理解方面的复杂问题,在信息抽取,文本摘要等应用中都用到指代消解,能够准确的进行指代消解,在自然语言处理中尤为重要。2015年至2017年,山西大学承担了国家“863”项目中的“语言问题求解和答案生成关键技术及系统”课题,主要负责基于篇章深层语义理解的阅读理解,在解决问题的过程中,指代消解的研究是研究的基础任务。基于这种需求,本文致力于研究并解决阅读理解中的指代消解问题。本文的研究主要分为以下三个部分:(1)利用N-Gram语言模型来解决指代消解问题进行指代消解,必须考虑到词语与词语之间的搭配关系,因此本文选择利用N-Gram语言模型来进行研究。研究的主要步骤是用候选的先行词将照应语替换,然后用模型来计算替换后句子的概率,将概率最高的词语或者短语作为最终的指代语。需要强调的是因为计算效果和空间消耗的制约,本文最终选择了二元语言模型,即Bi-Gram语言模型。(2)利用最大熵模型来解决指代消解问题在利用Bi-Gram语言模型研究之后,发现实验结果并不理想,研究其原因,在利用Bi-Gram语言模型时,并未用到句法、语义信息,导致指向不明确。所以在接下来的研究中,采用了最大熵模型,将句法、语义信息作为特征加入其中。研究的主要步骤是通过计算待消解对在特征上保持一致的概率来确定最终是否可以消解,在本文中使用的特征主要指单复数一致性,性别一致性,距离属性,句法特征,语义特征五个特征。(3)指代消解系统本文利用以上两种方法,构建了一个指代消解系统,该系统采用的语料是各省历年的高考语文阅读理解文章。为解决阅读理解问题提供了基础的技术支持。

其他文献

三百五十年来史可法评价问题述评

<正> 今年是民族英雄史可法殉难350周年。为弘扬爱国主义主旋律,江苏省社科联、江苏省社会科学院、江苏省历史学会、扬州市文化局、扬州市社科联、扬州市史可法纪念馆、扬州

期刊

史可法民族英雄梅花岭幸存录五十年

浅谈企业人力资源管理机制的构建

人力资源管理对企业的发展起到了举足轻重的作用。当今社会,人力资源成为现代企业最重要的战略资源,因此,必须加强人力资源管理,构建激励机制,完善企业人力资源管理的措施。

期刊

企业文化人力资源管理激励机制

新时期提高领导干部心理调适力的几点思考

领导干部是党和政府联系群众的桥梁和纽带,也是构建和谐社会和全面建设小康社会的重要力量。关注领导干部的心理健康是当前干部队伍建设的一个重要而紧迫的问题。

期刊

领导干部心理健康自我调适

基于可调谐半导体激光吸收光谱的甲烷传感系统

实验设计了一种基于可调谐二极管激光吸收光谱技术的甲烷传感系统,主要针对宽温度范围、全浓度、高精度的实时检测仪器进行研究。优选1653.7 nm窄线宽分布反馈式激光器作为光

期刊

光谱学可调谐二极管激光吸收光谱二次谐波检测全数字锁相温度补偿甲烷

《中共银川市委党校学报》发行与传播统计

<正>~~

期刊

温州沿海小型海岛植物丰富度和β多样性及其影响因子

于2012-2015年调查了温州沿海20个小型无居民海岛的植物组成,共记录到维管束植物366种,隶属于95科244属,其中草本植物226种木本植物140种。拟合了5个种-面积关系模型,采用赤

期刊

岛屿生物地理学物种丰富度种-面积关系空间特征小岛屿效应

Willis氏环后部的显微解剖学

在解剖显微镜下放大6～40倍,观察了125例成人和儿童脑Willis氏环后部的血管。颈内动脉末段两侧等粗者占47.20±4.46％,发出平均2.5条穿支,穿入前穿质、视束、灰结节和颞叶内侧面

期刊

大脑后动脉后交通动脉Willis穿动脉显微解剖学乳头体丘脑下部

中药神经再生素作用于背根神经节细胞过程中基因的表达变化

目的　探讨中药神经再生素 (NRF)作用的分子生物学机制。　方法　采用半定量PCR方法 ,观察和比较NRF组、NGF组和空白对照组中生长相关蛋白 4 3(GAP 4 3)、低分子量神经丝蛋白

期刊

中药背根神经节神经生长因子生长相关蛋白43低分子量神经丝蛋白

线绳缠绕机最佳出线方式的探讨

文章对国内缠绕机现有的三种出线方式的特点进行了比较,重点对转动武线轴受力情况作了理论分析,指出这种出线方式对提高缠绕机转速、增大线轴容量和解决线绳张力波动等方面都

期刊

出线方式同轴线缠绕机线绳缠绕

论生活方式与设计

众所周知,设计最终是为人的生活服务的,所以,设计与生活方式有着密切的联系,受着社会条件的制约和价值观念的引导,所以,设计就是设计人的生活方式。艺术设计引导人们走向更加

期刊

现代设计湖北美术出版社

指代消解的研究与实现

与本文相关的学术论文