基于框架语义标注的指代消解研究

被引量 : 1次 | 上传用户:hxs038
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
指代消解是自然语言处理的重点和难点之一。在文本摘要、机器翻译、多语言信息处理和信息提取等诸多应用中都有应用。作者研究框架语义标注的相关理论,如:FrameNet理论、CFN理论等其它的相关理论。作者研究了国内外大量文献和方案,这些文献是关于框架主义标注的指代消解的研究。根据最新研究情况和省自然科学基金的要求,本文提出基于框架语义标注的指代消解。根据研究中发现的不足之处,提出自己研究的内容。本文分析大量的研究,最后从以下3个方面进行了深入的研究:首先,构建了框架语料库。在指代消解研究中,语料是要处理的数据。研究过程中,实验先得收集语料。语料从两个方面进行收集,分别是教学课本和网络上,收集了121篇语料。语料采用LTP工具进行预处理。实验将121语料以XML形式存储。最后得到实验需要的语料。其次,基于规则与最大熵的指代消解的研究。算法中采用5种规则,单复数一致、句法搭配一致、性别一致、距离属性和语义信息一致。最大熵算法采用13种特征。最后用基于规则与最大熵算法的实验结果与最大熵算法的结果进行比较。两种算法都实现了指代消解。规则与最大熵实验结果比最大熵结果突出。最后,基于规则与树核函数的指代消解的研究。算法采用5种简单规则。算法抽取了5种结构化信息树,分别是MCT树、CT树、SPT树、MT树和RMLSPT树。算法采用26个特征。实验最好的结果为右最小左最短路径树。实验同时研究了基于树核函数的指代消解。基于树核函数的最好的实验结果是RMLSPT树。规则与树核函数的实验结果比树核函数的结果突出。
其他文献
<正>哈佛大学研究人员近日在于芝加哥举行的美国科学促进会2014年会上展示了一种"白蚁机器人",它们能像白蚁筑巢那样在没有总体设计和统一管理的情况下,自行垒起多层"砖块"。
当代科学哲学的发展正处于转型期,传统科学哲学的内在矛盾越来越尖锐,新的科学哲学传统的建立正处于探索之中。在这种背景下,为了全面了解德国科学哲学的研究与发展状况,我们
人类社会进入了信息化、数字化、学习化时代,数学的影响遍及人类活动的诸多领域,为人类文明提供了不断更新的理论、思想、方法和技术,并要求人们具有更高的数学素养。数学是
目的:观察保阴煎加减治疗育龄妇女上环后经期延长的临床疗效。方法:治疗组60例用予保阴煎加减治疗,对照组52例用常规西药治疗。结果:治疗组总有效率91.1%,对照组总有效率69.2
本文针对厚煤层综放工作面定稿版的初次来压和周期来压步距,采用现场观测的方法对3410综采工作面进行矿压观测,分析可得3410综放工作面的直接顶岩层的初次来压步距约为12~28m
随着国际原油价格剧烈而频繁地波动以及由于化石燃料的使用引起的环境恶化,重新激发起人类寻找新的可替代燃料的动力。发展绿色可再生能源是未来发展的方向,生物质作为一种重
德育的标准过高,利益冲突、个体的差异,舆论、同伴等外部环境的消极影响和道德实践的缺乏等问题,使得道德认知向道德行为转化屡屡发生断裂,知行脱节呈现普遍化,传统的内外化
目的验证注册护士核心能力量表(CIRN)的结构效度。方法量性描述研究设计,采用分层随机抽样方法,在澳门特别行政区两家综合性医院和7个卫生中心共抽取628名注册护士并发放问卷