深度学习与多元特征相结合的答案选择排序研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：sweetorange888

【摘要】

：

近年来,人工智能在诸多领域的尝试及成功,使其逐渐进入大众的视线。如何实现机器与人类的无障碍交流,是人工智能一直的研究内容。智能问答系统是实现这一愿景的非常有意义的

【作者】

：

赵姗姗

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2016年期

【关键词】

：

答案选择多特征融合深度学习神经网络 Attention机制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,人工智能在诸多领域的尝试及成功,使其逐渐进入大众的视线。如何实现机器与人类的无障碍交流,是人工智能一直的研究内容。智能问答系统是实现这一愿景的非常有意义的一个切入点。现有的问答系统形式有多种,比如社区问答、知识问答及聊天机器人等。这些系统往往有一定的知识存储,在回答问题的时候首先根据自身的知识背景生成若干与问题相关的候选答案,然后再通过相关计算对候选答案打分,最后返回问题的最佳答案。本课题主要研究了问题候选答案的选择排序问题,即对给定问题的候选答案集中每个答案打分排序。其核心问题就是计算问题和候选答案之间的语义相似度。通过对相关工作调研分析,可以发现,在已有的研究工作中,前期工作主要是基于问题和候选答案的词汇、句法等特征完成的。随着深度学习在NLP中的应用,近期工作多采用深度学习模型来研究,该模型不需要借助其他语言工具或知识资源辅助。本文尝试构建了将深度学习与句子特征相结合的模型,来完成问题候选答案的选择排序问题,本文的主要贡献有以下几个方面:1.分别抽取了问题和候选答案的词汇特征、主题特征以及基于IBM Model-I的问题和候选答案间的对齐特征,并将这些特征与LSTM模型结合。2.构建了基于深度学习的答案选择排序算法框架,分别采用CNN和LSTM两种深度学习模型进行实验。实验结果表明,在答案选择排序的任务中,当不加任何外部特征时,本课题里LSTM模型表现整体高于CNN模型。3.在LSTM模型中加入问题和候选答案的相关特征,将词汇特征追加到LSTM模型的输入部分,将主题特征与LSTM模型的输出做特征组合,再将对齐特征作为在LSTM模型中引入attention机制的基础。实验结果表明,在LSTM模型中,无论加入主题特征还是引入attention机制,在问题候选答案的任务上都有较为显著的效果。4.将本文的模型在公开数据集上进行实验,结果表明当将主题特征与对齐特征和LSTM结合时,两个评价指标MAP和MRR最高分别可以达到78.9%和80.0%,均高于现有的工作结果。该实验结果也证明了本课题所提模型的合理性和有效性。

其他文献

基于相关主题模型的文本分类方法研究

随着信息时代的来临,大量以文本格式存储的信息出现在Internet、数字图书馆及公司的Intranet上,基于人工智能的文本分类是处理这些文本信息的重要支撑技术。特征提取及文本表

学位

文本分类聚类相关主题模型遗传算法改进互信息

P2P网络中基于信誉的信任模型研究

伴随着互联网的飞速发展,P2P(Peer-to-Peer)网络作为一种分布式计算架构,进入我们的视野和生活,成为近年来业界研究和关注的一个焦点。P2P应用的蓬勃发展,也带来了种种的安全

学位

P2P信任模型信誉值信任值摇摆行为激励机制Chord

连铸板坯轻压下及二冷控制仿真设计与实现

随着计算机应用的不断普及,越来越多的生产企业依靠IT技术来缩短产品的生产周期、提高产品的质量水平、完善制造工艺。连铸作为炼钢的重要环节,如何缩短产品的生产周期、提高

学位

连铸二冷水轻压下传热模型

校园网统一身份认证平台的设计与实施

由于校园网初期建设的局限性,网络中各个应用系统的建设由各个职能部门自己负责,没有遵循统一的数据标准,数据格式也各不相同,系统间无法实现有效的数据共享,于是便形成了局

学位

CAGD中若干非线性样条曲线曲面的造型方法研究

本文对参数曲线曲面造型中的一种新的几何造型方法--非线性样条曲线曲面造型进行了深入的研究。其中包括基于三角／双曲多项式的类二次非均匀B样条曲线曲面,基于代数多项式、三

学位

几何造型三角多项式非线性样条曲线曲面有理插值样条计算机辅助几何设计

基于点采样和边缘特征的图像插值方法

图像插值技术是图像处理领域的基础技术,在图像处理领域有着重要的应用。经典的插值方法,一般是基于低通滤波的思想,实现简单,算法的计算复杂度可观。但是不能很好的处理图像

学位

区域采样拟合曲面边缘插值插值精度点采样

基于深度神经网络的文本蕴含识别及应用研究

文本蕴含识别作为自然语言处理中的一个重要基础任务,在问答系统、信息检索、信息抽取等很多任务中都有实际应用。传统的文本蕴含识别方法主要有基于人工特征的分类方法、基

学位

文本蕴含识别深度神经网络阅读理解记忆网络

基于语言模型的XML信息检索的研究与实现

随着互联网技术的迅速发展,Internet上的信息量正呈指数级的方式递增。因此,为使人们能够有效地从浩瀚的信息海洋中获取有用的信息,各种Internet信息检索服务应运而生。但是,

学位

语言模型XML信息检索检索模型XML索引

开放RFID公共服务平台的研究与设计

无线射频识别RFID,作为一种新兴识别技术,凭借自身特有的优势,已开始逐步取代条码,并在企业中扮演愈来愈重要的角色。随着RFID应用的逐步深入和推广,RFID应用开始由闭环应用

学位

无线射频识别公共服务平台发现服务对象命名服务产品电子编码

深度卷积神经网络及其在图像测距中的应用研究

学位

深度学习与多元特征相结合的答案选择排序研究

与本文相关的学术论文