机器阅读理解模型中的关键问题研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhyanhz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
AI正在多个领域中掀起着变革热潮,其中自然语言处理要求人工智能对人类语言的处理、理解和运用,可是说是真正意义上的“人工智能”,因此对AI来说有着意义重大。而机器阅读理解则是实现语言智能的关键一步,其主要涉及到深度学习、自然语言处理和信息检索等领域知识,能够让计算机帮助人类在大量文本中找到想要的答案,从而减轻人们对信息的获取的成本。本文对机器阅读理解模型中的关键问题从三个方面进行研究:考察现有模型的建模能力、深度学习模型中融入外部知识以及深度学习模型自身框架在attention上的的改进和对面向大规模的中文Du Reader数据集上的阅读理解系统从答案预筛选和模型优化两方面进行了改进。本文的主要研究内容为以下几个方面:第一,对机器阅读理解深度学习模型进行了分析和对比。从进行答案句筛选和答案片段筛选的阅读理解模型中,我们分别挑选了基于attention的QA-LSTM模型和Bi DAF模型,对两个模型的架构及attention机制进行了详细介绍,然后对两个模型从多个方面进行了对比。最后在实验中对两个模型的性能进行评估与对比。第二,对机器阅读理解深度学习模型从两方面进行改进。一方面是深度学习模型中引入先验知识。首先调研梳理了词法、句法、语义等层面的语言学知识;其次探究了在深度学习框架下各种先验知识以不同形式在网络架构下的各个网络层下的引入方式。我们在各级别语言学知识中挑选出具有代表性的知识,进行先验知识引入深度神经网络的实验。另一方面是对深度学习模型中的attention粒度进行了探讨。我们尝试在Bi DAF基模型中引入了三种问题到篇章的句子级别的更粗粒度的attention,并通过实验进行了综合分析。第三,基于中文阅读理解数据集Du Reader,对阅读理解系统从答案预筛选和模型两方面进行了改进,其中答案预筛选包含两部分内容,即答案段落筛选和答案片段定位。对答案预筛选的改进,我们采用了全局筛选策略及基于逻辑回归模型的筛选策略。模型方面,我们在Bi DAF基模型中加入了selfattention机制,并将训练目标修改为共享归一形式。最终我们在BLEU-4取得了6.25个点的提升,ROUGE-L上4.79个点的提升。
其他文献
目的 :对单焦点和多焦点人工晶状体植入术后的拟调节力进行比较。方法 :选取合适的老年性白内障患者 ,分为两组。Ⅰ组 :30例 32只眼 ,植入AllerganArraySA 4 0NBTM多焦点人工
<正>我承认这辆本田车和印度的人力黄包车有天壤之别。空调、立体式音响系统、DVD播放器,更不用提防水车篷了。驾驶着这样银光闪闪的豪华轿车,让人心情舒畅。但是,世界上任何
高等教育大众化的发展需要学生管理工作的改革和创新。学校社会工作坚持助人自助理念,借助专业化、科学化、人性化的方法,围绕特殊的个人(案主)开展工作,致力于改善学校学习
为了查清浮选废水中残余黄原酸盐的净化特性,通过充气氧化和添加氧化剂(双氧水、次氯酸钠)进行氧化试验,用粉末活性炭进行吸附试验,用紫外分光光度法测定黄原酸盐的质量浓度,
目的:探究老年肺炎患者的综合护理效果。方法:选取2016年1月~2017年1月收治的老年肺炎患者80例进行研究,将上述患者随机分为两组。对照组接受常规护理,观察组接受综合优质护
文章将共生理论运用于港口物流产业集群的研究,并给出相关定义。以共生视角探讨港口物流产业集群的特征:同一性、多样性、专业性、同进化性、根植性和自主增容性,确定了共生
介绍了以单片机为主控制核心的多功能音频监控仪的设计与实现,该系统能够实现看守所内的广播、监听、报警等功能,从而有效地提高看守所的控制和管理力度.
文章对股市宏观调控研究作了简要回顾,运用VAR模型对货币政策调控股市的有效性进行了最新检验,结果表明货币政策对股市调控的效果不显著;同时,现有的财政政策调控属于漏损型
通过分析嵌入式语音识别技术和智能家居控制的原理,设计了基于智能家居控制的一种非特定人孤立词的语音识别系统.该系统由ARM11处理器和WM9713语音处理等核心芯片组成,采用Wi
随着全球经济一体化进程的加快,港口供应链研究受到越来越多人的关注。文章总结归纳了近年来国内外港口供应链管理方面的研究成果,指出研究中的不足,提出了今后的研究方向和