基于深度学习的智能问答系统研究

来源 :电子科技大学 | 被引量 : 4次 | 上传用户：wang840911

【摘要】

：

近年来,随着人工智能领域尤其是深度学习的快速发展,自然语言处理在人类的学习工作与生活中正发挥着越来越重要的作用。智能问答的出现使得一大批应用或服务涌现出来,如百度

【作者】

：

李敬鑫

【出处】

：

电子科技大学

【发表日期】

：

2020年01期

【关键词】

：

智能问答自然语言处理预训练模型 ALBERT SQuAD数据集

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着人工智能领域尤其是深度学习的快速发展,自然语言处理在人类的学习工作与生活中正发挥着越来越重要的作用。智能问答的出现使得一大批应用或服务涌现出来,如百度的小度,阿里的天猫精灵,小米的小爱同学,苹果的Siri。智能问答是知识的一种表现形式,知识是人类最宝贵的财富,所以研究智能问答对于人类知识的提取与运用有着重要意义,让机器明白的比人类更多,回答的更准确,这是智能问答研究者的共同目标。但是智能问答领域还不是特别成熟,很多人想当然的把科幻水平误认为是当今的发展水平,所以要提高智能问答系统的准确率,让机器更智能,回答的问题更接近于人类甚至超越人类的水平,让人类对机器的回答更满意。本文的研究就是基于此目的。首先介绍了自然语言处理的基本模型,从独热编码,词嵌入到Seq2seq(sequence to sequence),然后介绍了由Transformer带火的预训练模型尤其是BERT(Bidirectional Encoder Representation from Transformers),标志着自然语言处理进入了黄金时期。自然语言处理的概念或基础为之后深入研究智能问答打下了坚实的基础。然后在基本模型双向注意力流即BiDAF(Bidirectional Attention Flow)模型的基础上,使用数据集SQuAD 2.0(Stanford Question-Answering Dataset)作为训练数据,使用精确匹配EM值(Exact Match)和模糊匹配F1的值作为评价指标,EM值代表模型预测的答案和标准答案是否完全一样,EM值越大就表示模型预测的结果和标准答案越接近;F1参数是根据模型给的答案与标准答案的重合度求出一个0到1之间的分数,这个分数就是精确率和召回率的调和平均。经过训练,得到BiDAF模型在SQuAD 2.0数据集上的表现是EM值为58.60,F1为61.95。最后,使用预训练模型ALBERT(A Lite BERT)进行研究,共分为5个模型进行研究,模型一直接使用ALBERT加输出层,模型二在ALBERT的基础上增加了高速网络,模型三则增加了门控循环单元GRU(Gate Recurrent Unit)和注意力层,模型四是GRU加高速网络,模型五是使用ALBERT-xxlarge版本。经过训练,在使用ALBERT基础版本的模型一、二、三、四中,模型一直接加输出层的效果最好,比基本BiDAF模型EM值提高了17.68,F1值提高了16.73。5个模型中ALBERT-xxlarge版本效果最好,较BiDAF模型的EM值提高了24.35,F1值提高了23.35。本论文的创新点是使用了现今最强大的ALBERT模型进行研究,而不是用前一两年很火的BERT或XLNet进行研究。在ALBERT的基础上,提出了添加不同层来进行研究的方法,极大的提高了在SQuAD 2.0版本数据集上的准确率。其中参数最多的ALBERT-xxlarge模型效果最好,比基础模型的EM值和F1值分别提高了41.55%和37.69%,效果显著。

其他文献

克服人性的弱点

<正>一个人如果能够不断克服自己的弱点,就不会走上人生的岔路,当然更不会陷入人生迷途和毁灭的陷阱。可悲的是,许多人只看到别人人性的弱点,而看不到自己人性的弱点。一位科

期刊

和尚

对流传热问题的粒子-网格混合方法数值模拟

移动粒子半隐式(MPS)方法是一种完全基于拉格朗日体系的粒子法,应用于不可压缩流体。MPS方法在描述存在大变形和相变的问题时具有很大的优势。然而当MPS方法中的Laplace模型

期刊

粒子法网格法对流传热particle methodgrid methodconvective heat transfer

坚定不移地推进西部大开发战略

期刊

西部大开发战略部署战略意义“三个代表”十六大精神

黄骅坳陷中、古生界潜山油气藏的差异成藏研究

本文以黄骅坳陷中生界、古生界潜山油气藏为研究对象,综合利用地质、地球物理、地球化学等资料,结合薄片观察、油气运聚物理模拟实验等方法,对黄骅坳陷中生界、古生界典型油

学位

潜山油气藏成藏要素富集规律主控因素有利区预测

乘风红鹭破浪飞—白银红鹭铝业公司发展纪实

【正】白银红鹭铝业公司是白银有色金属公司铝厂依照现代企业制度要求改制的公司制企业,是白银有色金属集团公司的控股子公司和核心企业之一。铝业公司是国家七·五期间

期刊

白银红鹭铝业公司核心竞争力技术改造现代企业制度企业管理经济效益企业文化

“模拟动物种群密度调查的标记重捕法”实践的一些改进

文中依托建构主义理论,通过控制无关变量,对苏教版必修3教材上的标记重捕法模拟实验中的实验材料和实验方法做了一些改进,认为能使高中学生更好地领悟标记重捕法。

期刊

标记重捕法模拟实验实践改进建构主义无关变量合作学习

瑞芬太尼诱发痛觉敏化效应在肝硬化及颈椎疾病手术患者上的研究

目前,瑞芬太尼因其时效-半衰期曲线稳定、无蓄积效应而成为临床麻醉中使用的主要阿片类药物。然而其诱发的痛觉过敏(Opioid-induced hyperalgesia,OIH)可增加术后其他镇痛药的用量,进而导致相关并发症的发生率增加。针对瑞芬太尼的OIH现象,临床麻醉中采用提前介入使用舒芬太尼、氯胺酮等以及术后镇痛采用电子泵泵注舒芬太尼复合配方(复合使用非甾体类镇痛药)等方式,即避免瑞芬太尼OIH

学位

瑞芬太尼痛觉过敏肝硬化逐级撤药骨科颈椎手术

激进右翼政党与欧洲一体化的政治化问题探析

近年来,欧洲一体化进程受到激进右翼政党崛起的极大挑战。激进右翼政党作为反欧盟势力中最具代表性的政党团体,是欧洲一体化的政治化现象的重要推动者。欧洲一体化的政治化现

期刊

激进右翼政党欧洲一体化的政治化欧盟

社区志愿组织参与城乡结合部环境治理的路径创新研究

在城市化步伐加快的节奏下,城乡结合部的范围逐步增大,城乡结合部居民的诉求也更具多元性,一部分居民要顺应从散居到群居的环境改变,一部分居民要在环境利益冲突中寻求平衡点,他们林林总总的诉求要获得满足,就使得城乡结合部的环境治理显得尤为重要。同时,党的十九大也将满足人民对美好生活的向往作为奋斗目标,提升城乡结合部的环境也是这一奋斗目标的重要组成部分。我国城乡结合部环境治理虽然得到了政府的支持和重视,治理

学位

社区志愿组织城乡结合部环境治理路径

基于随机森林回归的制丝过程参数影响权重分析

为提高制丝工艺质量评价中参数赋权分析的科学性和客观性,选取＂云烟＂某规格一类卷烟制丝过程全批次数据的稳态数据样本,通过Pearson相关性矩阵筛选各工序出口含水率的解释变量,

期刊

制丝过程稳态数据样本Pearson相关性随机森林回归权重分析Primary processing Steady state data sample P

基于深度学习的智能问答系统研究

与本文相关的学术论文