基于最大熵模型的英文名词短语指代消解

来源 :复旦大学 | 被引量 : 0次 | 上传用户:ah12345679
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文针对英文名词短语的指代消解问题,提出了一种基于最大熵模型的学习算法:1.我们利用少量的标注语料供最大熵模型训练,产生规则集,取代了传统的手工构建规则集的做法.该模型具有较高的精度,试验结果证明其在指代消解问题上是比较成功的.2.该文采用的方法——有指导的机器学习策略,在英文名词指代消解问题上取得了与最优的非机器学习方法可比的成绩.该文设计的系统在MUC-7的评测语料上达到的性能接近参评系统的最优成绩.3.该文设计的指代消解系统,作为一个组成部分被引入到文本摘要系统中,试验结果证明了其有效性.而该文本摘要系统在DUC2003上取得了较好成绩.4.我们设计了一个演示系统,用以直观地显示文本中指代链的情况.
其他文献
在远程教育大力推广的今天,虚拟实验已被广泛应用于远程教育实验教学系统中.由于计算机程序执行的动态效果和计算机硬件的时序变化关系较难仿真,从而很难反映出硬件实验现象
本论文在介绍了“NTN”校准技术背景的基础上,详细阐述了“NTN”校准技术的原理、实现过程及优势。本文的主要研究内容是用PSPICE软件对“NTN”校准技术的关键理论、方法进行
七号信令网是通信网的神经中枢,在电话网、移动网、智能网等通信网中已成为不可缺少的一部分,其畅通与否直接关系到整个电信网的通信质量,这就需要一套监测系统对七号信令全网进
在高通量众核处理器执行任务过程中,众核处理器共享资源有限而资源消费者众多,这给处理器的调度策略带来挑战。高通量众核处理器属于并行体系结构,其核心部件资源为处理器核、存
家庭多媒体服务器是数字会聚、3C融合的产品.计算机、半导体设计和制造以及网络技术的飞速发展促进了家庭多媒体服务器的出现;信息家电的兴起加速了家庭多媒体服务器平台的研
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识.数据挖掘是信息技术自然演化的结果.目
分布式数据环境的信息交换和信息共享,复杂的分析型应用等都要求在前所未有的规模上集成数据。数据集成系统预先把数据从分布自治并可能异质的远程信息源中抽取出来,经过数据转
随着Internet的飞速发展,网上丰富的资源产生着巨大的吸引力。接入Internet、访问Internet成为当今信息业最为迫切的需求,但这受到IP地址的许多限制。新的IPv6一种很好的解决方
该文在总结归纳现有理论和技术成果的基础上,独立地完成了下列有特色的工作:(1)针对机会的"意外性"特性,用群体的隐式信念描述相对于单个agent的机会;(2)提出了两层概率模型
虚拟专用网(VPNs)是有效利用公用网络作为专用网的一种最有前途的方法。VPNs利用隧道技术,以很低的成本为远程访问、Extranet和Intranet应用提供了穿越公用网络的安全稳定的通