【摘 要】
:
近年来,随着交互式问答应用的兴起,越来越多的人关注人机交互式的信息获取形式,大部分的自动问答系统都是基于FAQ的形式,而没有对问题本身进行理解,本文面向对用户问题的理解,针对
论文部分内容阅读
近年来,随着交互式问答应用的兴起,越来越多的人关注人机交互式的信息获取形式,大部分的自动问答系统都是基于FAQ的形式,而没有对问题本身进行理解,本文面向对用户问题的理解,针对于用户问题中存在省略现象的句子,应用自然语言处理的相关技术进行相应的处理,进而使计算机能够理解用户的问题,从而为后续的检索和答案抽取提供服务。 当前国内对于省略恢复的研究基本上是基于理论层面,没有给出相应的实验验证,但是对于中文省略恢复理论的研究还是有一定的发展;国外的研究人员更加关注零型指代的消解研究,零型指代与省略恢复有一定的相似性,但是省略恢复任务相对于零型指代消解的研究而言更加的复杂,而且对于零型指代消解的研究大都是基于篇章级结构的,因此与我们所研究的中文交互式问答还有所不同,本文在借鉴国内外相关研究人员的研究成果和中文交互式问答中的特点,提出了一种省略恢复模型,并且通过实验验证了该模型的效用性,本文中的省略恢复模型大体上分为两个部分,第一个部分是省略的判定部分,我们应用句法和语义的相关信息进行省略的判定;第二部分为省略恢复部分,这部分又分为两个子任务,一方面我们首先利用二元分类的方法产生恢复候选词,另一方面我们基于中心理论的相应方法对省略成分进行选择从而达到省略恢复的目标,我们以TRECQA2004-2007的翻译问题作为实验的数据集,本文的方法在该数据集上达到了68.67%的准确率,75.00%的召回率和71.64%的F值。
其他文献
随着中国互联网用户的爆炸式增长,中文信息处理技术在互联网领域受到越来越多的重视。中文组块分析,因其在具有词法分析效率的同时又具有接近于完全句法的分析深度,在互联网领域
随着计算机技术和网络技术的飞猛发展,人类社会的信息化进程大为加快,对信息的依赖程度越来越高。保险公司也依靠IT系统处理案件。自从20世纪70年代《协同学导论》的出现,使
针对互联网个人影像产品制作过程中,传统手工操作复杂、耗时、并造成网络与服务器高负荷运转的问题,探讨了一种基于等级变异与图像内容特征信息的免疫克隆算法。并以比较复杂
三峡库区河段地质情况复杂,桥梁众多,常常发生船桥相撞事故,对航运安全形成威胁。为此论文提出对三峡库区航运安全进行虚拟现实仿真系统及相关技术的研究,以三峡库区重点航段
共指消解是自然语言处理中的核心任务,它对于篇章分析、自动文摘、信息抽取、信息检索、信息过滤和机器翻译等都具有重要的意义。本文采用基于实例的动态泛化机制,在中英文上
随着信息技术和网络技术的发展,互联网上的信息和资源出现了爆炸性的增长。为了提高用户的有效信息获取能力,个性化推荐系统将会发挥越来越重要的作用。传统的协同过滤推荐技
近年来,计算机和互联网技术的迅速发展越来越显著地改变着人们的生活,多媒体就是借助这两项技术而诞生的应用领域。因此,保护多媒体信息的安全成为人们日益关注的问题。加密
随着无纸化办公成为当前的发展趋势,电子文档得到了广泛应用。各级政府及军事科研机构等部门大量涉密信息都以电子文档的形式存在。电子文档的安全问题便成为一个亟待解决的
虹膜识别是新兴的生物识别技术之一,受到了信息安全领域研究者的广泛关注。与其他生物特征识别技术相比,虹膜识别具唯一性、稳定性、防伪性、非侵入性等特点,使得虹膜识别技
随着网络在全球的普及,Internet已经深入到人类社会的方方面面,随之而来的,与Internet相关的安全事件愈来愈多,对人类生产与生活的影响也日益严重。尤其是蠕虫、僵尸网络以及DDOS