深度学习与多元特征相结合的答案选择排序研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sweetorange888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能在诸多领域的尝试及成功,使其逐渐进入大众的视线。如何实现机器与人类的无障碍交流,是人工智能一直的研究内容。智能问答系统是实现这一愿景的非常有意义的一个切入点。现有的问答系统形式有多种,比如社区问答、知识问答及聊天机器人等。这些系统往往有一定的知识存储,在回答问题的时候首先根据自身的知识背景生成若干与问题相关的候选答案,然后再通过相关计算对候选答案打分,最后返回问题的最佳答案。本课题主要研究了问题候选答案的选择排序问题,即对给定问题的候选答案集中每个答案打分排序。其核心问题就是计算问题和候选答案之间的语义相似度。通过对相关工作调研分析,可以发现,在已有的研究工作中,前期工作主要是基于问题和候选答案的词汇、句法等特征完成的。随着深度学习在NLP中的应用,近期工作多采用深度学习模型来研究,该模型不需要借助其他语言工具或知识资源辅助。本文尝试构建了将深度学习与句子特征相结合的模型,来完成问题候选答案的选择排序问题,本文的主要贡献有以下几个方面:1.分别抽取了问题和候选答案的词汇特征、主题特征以及基于IBM Model-I的问题和候选答案间的对齐特征,并将这些特征与LSTM模型结合。2.构建了基于深度学习的答案选择排序算法框架,分别采用CNN和LSTM两种深度学习模型进行实验。实验结果表明,在答案选择排序的任务中,当不加任何外部特征时,本课题里LSTM模型表现整体高于CNN模型。3.在LSTM模型中加入问题和候选答案的相关特征,将词汇特征追加到LSTM模型的输入部分,将主题特征与LSTM模型的输出做特征组合,再将对齐特征作为在LSTM模型中引入attention机制的基础。实验结果表明,在LSTM模型中,无论加入主题特征还是引入attention机制,在问题候选答案的任务上都有较为显著的效果。4.将本文的模型在公开数据集上进行实验,结果表明当将主题特征与对齐特征和LSTM结合时,两个评价指标MAP和MRR最高分别可以达到78.9%和80.0%,均高于现有的工作结果。该实验结果也证明了本课题所提模型的合理性和有效性。
其他文献
随着信息时代的来临,大量以文本格式存储的信息出现在Internet、数字图书馆及公司的Intranet上,基于人工智能的文本分类是处理这些文本信息的重要支撑技术。特征提取及文本表
伴随着互联网的飞速发展,P2P(Peer-to-Peer)网络作为一种分布式计算架构,进入我们的视野和生活,成为近年来业界研究和关注的一个焦点。P2P应用的蓬勃发展,也带来了种种的安全
随着计算机应用的不断普及,越来越多的生产企业依靠IT技术来缩短产品的生产周期、提高产品的质量水平、完善制造工艺。连铸作为炼钢的重要环节,如何缩短产品的生产周期、提高
由于校园网初期建设的局限性,网络中各个应用系统的建设由各个职能部门自己负责,没有遵循统一的数据标准,数据格式也各不相同,系统间无法实现有效的数据共享,于是便形成了局
学位
本文对参数曲线曲面造型中的一种新的几何造型方法--非线性样条曲线曲面造型进行了深入的研究。其中包括基于三角/双曲多项式的类二次非均匀B样条曲线曲面,基于代数多项式、三
图像插值技术是图像处理领域的基础技术,在图像处理领域有着重要的应用。经典的插值方法,一般是基于低通滤波的思想,实现简单,算法的计算复杂度可观。但是不能很好的处理图像
文本蕴含识别作为自然语言处理中的一个重要基础任务,在问答系统、信息检索、信息抽取等很多任务中都有实际应用。传统的文本蕴含识别方法主要有基于人工特征的分类方法、基
随着互联网技术的迅速发展,Internet上的信息量正呈指数级的方式递增。因此,为使人们能够有效地从浩瀚的信息海洋中获取有用的信息,各种Internet信息检索服务应运而生。但是,
无线射频识别RFID,作为一种新兴识别技术,凭借自身特有的优势,已开始逐步取代条码,并在企业中扮演愈来愈重要的角色。随着RFID应用的逐步深入和推广,RFID应用开始由闭环应用
学位