非事实类问题的自动应答技术研究

来源 :苏州大学 | 被引量 : 2次 | 上传用户:xiaoyuzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答是一种通过分析用户所提出的问题,结合知识库或者上下文信息,自动返回一个精准答案的技术。按照用户所提出的问题类型,自动问答任务可粗分为:事实类问题(例如When,Who,Where等)应答和非事实类问题(例如How,Why,解释类等)应答。本论文主要关注于非事实类问题的应答。对于这个任务,目前主流的工作关注于阅读理解式的非事实类问答和答案选择式的非事实类问答。然而,阅读理解式问答研究并非专门针对非事实类问题展开的,现有的数据集大部分都混杂着各种类型的问题,不利于我们专门研究Why型或者How型等非事实类问题的阅读理解问答技术;而现有答案选择式的非事实类问答仅关注于问题与候选答案之间的相关性,却往往忽略了与问题有关的上下文信息。因此,本文的主要工作包括:(1)为了解决现有Why型问答模型生成答案的语义不一致问题,本文提出了一种基于因果知识库和段落自匹配的Why型问答模型。该模型通过整合不同层级的注意力机制和序列到序列结构来生成W h y型问题的答案。(2)本文提出了一种基于答案检索和答案选择的非事实类问答框架。一方面,利用语义相似度方法来过滤与输入问题不相关的候选答案。另一方面,通过引入答案上下文信息,将原始答案选择式的非事实类问答任务转换为复杂的多项选择式阅读理解任务。为此,本文新颖地提出了一种基于答案上下文和胶囊网络的问答模型。该模型融合了不同视角的答案感知的注意力机制和胶囊网络,进而能够从候选答案集中选出与输入问题相关的最佳答案。本文在多个真实数据集上验证了所提模型和方法的有效性。实验结果表明,本文提出的基于段落自匹配的Why型问答模型,在构建的中文数据集和公开的英文数据集上的效果远好于现有的问答模型。本文提出的基于答案上下文和胶囊网络的问答模型在两个数据集上的表现都要优于现有的答案选择式的非事实类问答方法。
其他文献
卫星激光通信是以激光光波作为载体,以大气作为介质的无线通信技术,信道容量大,保密性强,抗干扰能力强,具有良好的应用前景。瞄准、捕获、跟踪(PAT)技术是保障卫星激光通信系
全面从严治党是党的十八大以来党中央作出的重要部署,是“四个全面”战略布局的重要组成部分,是推动全面建成小康社会的鸟之翼、车之轮。党的十九大继续强调要坚定不移全面从
自1921年创建私立女校自由学园,至1950年在自由学园建成一套从幼儿园到大学的男女同校的一贯制教育体系,羽仁元子(1873-1957)在其近三十年的教育生涯中,始终将“生活即教育”
形状是图像的一种底层特征,在图像处理与计算机视觉领域有着广泛应用。在单一的尺度下我们无法对形状进行有效的描述和检索。具体来说,如果尺度值设置过低,虽然能够捕捉形状
有机电致发光器件(Organic Light-emitting Device,OLED)因具有驱动电压低、视角广以及可实现柔性显示等优势,被誉为下一代固态照明和平面显示。尤其是白光OLED(White OLED,W
本文采用实验探究、理论分析和数值模拟相结合的方法,对含不同乙醇浓度的两组分胶体液滴在超疏水表面上蒸发和沉积的动力学过程进行研究。通过系统的实验,分析了液滴的接触半径、接触角和蒸发速率随时间的演化规律,并与现有理论模型进行对比。实验结果表明蒸发行为主要受液滴内乙醇浓度的影响:低乙醇浓度时,液滴的蒸发速率较慢且趋于常接触角(CCA)模式;高乙醇浓度时,液滴的蒸发速率较快且趋于常接触半径(CCR)模式。
为了提高大中型建筑空调系统的控制品质,并降低系统的运行成本,越来越多的学者进行了空调系统的控制研究。大中型建筑空间巨大、温度分布多样化、系统控制端口有限、控制目标
有机电致发光二极管(OLED)经历了近三十多年的发展,性能不断完善,被人们认为是理想的接替液晶(LCD)显示的第三代平板显示技术。与此同时,其凭借着自身所拥有的广视角、宽色域
自由空间光通信中的大气激光通信的通信链路为大气信道,而大气信道由于受到天气变化的影响而不稳定,有时恶劣的天气会导致光接收端的信号很微弱,甚至达到光子级别,所以起初大
硅和聚3,4-乙烯二氧噻吩:聚苯乙烯磺酸(Si/PEDOT:TSS)组成的异质结太阳能电池因其聚合物制备过程简单、器件性能良好以及成本低廉等优点,成为一种优良的光伏电池的制备技术。其陷光性结构优化、复合界面改性与器件结构改造对提高电池器件效率具有重要意义并成为太阳能电池领域中的研究热点。本文采用MACE法、水热法、化学腐蚀等多种方法制备样品,采用SEM、UV-Vis、少子寿命测试、太阳能电池测试系