交互式问答中的指代消解研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:a595420725
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交互式问答受到了越来越多的关注。但交互式问答中存在着各种各样的语言现象,这些现象使得计算机难以充分理解用户的提问,指代现象就是其一。近年来,国内外许多学者对指代消解进行了大量细致的研究。但大部分研究都针对新闻文本中的指代进行,本文以已有的针对新闻文本的指代消解方案为基础,结合交互式问答自身的特点提出了适用交互式问答的指代消解方案。本文主要工作及贡献包括:首先,标注了交互式问答的指代消解语料。借鉴新闻指代消解的成熟标注方案,我们选取交互式问答领域广泛使用的TREC2004至TREC2007的评测语料进行了指代信息的标注,并就指代现象比较了交互式问答与传统新闻文本的异同。其次,提出了适于交互式问答的待消解项识别方法。分析传统的针对新闻文本的待消解项识别方法应用于交互式问答的不足,提出了针对交互式问答的待消解项识别新特征,改善了交互式问答中待消解项识别的性能。再次,针对交互式问答提出了基于话语结构的指代消解方法。分析传统针对新闻文本的指代消解方法在交互式问答中的不足,以交互问答场景中的话语结构理论为基础引入了描述话语结构的特征集。实验结果表明,新引入的话语特征能改善指代消解的性能,系统的F值提高了2.6%。最后,提出了基于中心理论和话语结构的指代消解方法。以中心理论为基础,利用话语结构获取问句中的优选中心,再结合话语结构中的话语转换信息确定句子之间的跳转关系。在此基础上引入了中心理论和话题结构相关的新特征集。实验结果显示这一方法能大大提高交互式问答中指代消解的性能,F值提高了3.2%。
其他文献
随着Web服务研究的不断深入和大量稳定易用的Web服务的广泛应用,如何从众多的服务中高效地发现满足需求的Web服务是一个需要解决的问题。传统的基于UDDI和WSDL标准的Web服务发
互联网和信息技术的飞速发展使我们进入了“信息经济”时代。互联网的用户的规模不断增大,互联网服务对于网络带宽与传输速度的需求不断增加。此外,互联网应用以及用户的多样性
组合编码的计算量非常巨大,编码过程非常耗时,本文在理论研究的基础上,进一步探讨了组合编码并行技术,以期缩短计算时间。在理论研究方面,本文从通用组合编码的性质出发,对通用组合
互联网技术的快速发展所产生的海量信息易造成信息过载问题,导致人们无法从这些海量信息中快速找到所需的信息。解决信息过载问题以帮助人们快速获得所需信息已引起研究者的广
数据可视化应用于金融领域,把晦涩冗杂的数据转变为直观的二维三维可视化结果,有助于用户发现和分析金融数据背后的逻辑,迅速做出准确判断和决策。因此研究如何将可视化技术更好
随着数据流的不断发展和应用,在数据流环境下的数据挖掘已经成为获取信息的主要方式,尤其是最大频繁模式的挖掘已成为当今的研究热点,它能提供决策支持和商业预测,因此在实际
目前电力企业的配用电系统主要包括配电自动化系统、用电信息采集系统、营销管理系统等,但它们大多是孤立的,没有形成数据共享,造成信息孤岛多、互操作性差等诸多问题,妨碍了跨部
随着网络规模的不断扩大,电力通信网中资源类型繁多,资源间连接关系日趋复杂,对电力通信资源进行统一有效管理的需求日益迫切。如何对电力通信资源的属性状态和连接关系进行快速准确的识别已经成为影响高效管理的重要问题之一。本文就该问题深入研究了电力通信资源网络拓扑可视化及传输业务的最优路径选取问题。文章针对电力通信资源管理面临的问题和挑战,明确了对电力通信资源网络进行拓扑可视化优化的必要性和现实意义。重点研
虚拟化技术出现已经有几十年的历史,给企业和个人使用计算机资源带来了极大的便利,使得计算资源得到更加充分的利用。现在随着云计算技术的普及,虚拟化技术作为云计算中的关键技
目前软件定义网络架构(Software-Defined Networking,SDN)存在流表项资源消耗与控制器负载过大等问题。这些问题会直接影响到网络的转发能力和扩展性。分段路由技术的核心思想是