基于多任务学习和低秩分解的低资源环境任务型对话系统

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hu8245
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于词向量技术和预训练模型的深度学习方法虽然对于任务型对话系统效果提升明显,但是存在模型计算量和参数量过大的问题,对部署模型的服务器资源条件要求很高。如何在保持模型效果的情况下,尽量减小模型的参数和体积,对于对话系统落地有着非常重要的意义。使用多任务学习和低秩分解技术对传统任务型对话系统的自然语言理解和自然语言生成模块进行了改进,并使用改进的模型实现了一个完整的建筑领域文档对话系统。1)为兼顾自然语言理解模块的效果和速度,提出了基于双向LSTM和Attention意图检测和词槽填充多任务学习模型MTLA。一方面,通过进行词语级和字符级多粒度特征融合、使用双向LSTM和Attention模型分别捕捉文本序列特征和全局特征以及对两个任务的损失函数进行联合优化三种方法提升了模型的准确度。实验结果表明,MTLA模型在三个数据集上相对于基准模型准确度提高了2到3个百分点。另一方面,通过相加融合特征以及去掉CRF层两种方法提高了模型的预测速度,并验证了两种方法的有效性。2)针对MTLA模型参数量较大的问题,进一步对模型的LSTM层、Attention层和Dense层的参数进行了TSVD分解和TT分解,提出了TT-Attention,最后在三个数据集详细比较了压缩前和压缩后模型的参数量、推理速度、显存内存资源占用等方面的效果。结果表明基于相比于TSVD方法,TT分解可以在保持模型性能的情况下,大幅降低模型的资源占用并提升推理速度。3)针对传统NLG中IR和MRC模块存在的多级输入导致误差累积的问题,提出了基于BERT模型的检索和阅读多任务学习模型HW-MTBERT,提升模型性能的同时减小了模型的体积。同时为改善多任务学习模型对输入问题关键词不敏感的问题,引入了关键词表征增强了模型的感知能力。结果表明,HW-MTBERT模型的阅读准确度提高了近1个百分点,检索准确度提高了2个百分点。4)最后以开源对话系统框架RASA为基础,将其NLU模块和NLG模块修改为提出的模型,并在我们标注的建筑领域数据集上对系统进行了评估。
其他文献
短语识别技术在语义理解任务中扮演着十分重要的角色。短语识别技术对已经正确分词和词性标注好的句子,自动划分出不同单元块的短语,可以提升计算机对自然语言的理解能力,也对后续的深层的文本意图、情感分析等环节有很大帮助。为了得到准确率较高的短语识别模型,对用户输入数据进行了清洗,过滤其中无意义的符号,并按照不同类别符号切分单句;基于CBOW模型训练了word2vec中文词向量并随机初始化训练词性向量,拼接
传统中心化系统之间难以达成互信,难以实现信息数据共享,使用传统方法在中心化系统之间实现数据交互需要耗费大量人力与时间成本。区块链技术具有天然去中心化的特性,能够通过技术手段解决不同机构之间互信的问题,因此将应用迁移到区块链平台上能够减少人力与时间成本。从传统系统迁移到区块链系统时,存在数据交易顺序难判定、上链数据交易无法修改的问题。因此需要构建面向多方数据迁移的链上修复机制。设计了面向多方数据迁移
某大功率机车检修段现阶段机车转向架螺栓装配的工艺要求主要依靠纸质手册,为了提升螺栓装配效率,需要研究开发利用增强现实技术的机车转向架螺栓辅助装配AR系统。机车转向架螺栓众多且在装配时需要能将每个螺栓都进行识别和定位,现有的增强现实技术无法同时满足这两个要求,本文采用YOLOv3目标检测算法实现增强现实,研究了虚拟指示的稳定跟踪和螺栓装配作业正确性监管,主要研究内容如下:首先,研究了基于YOLOv3
随着微电子产品越来越多的被运用在生活当中,其核心技术嵌入式系统也成为了研究和开发的重心。嵌入式软件的开发技术以及开发环境又与嵌入式软件的质量和开发效率戚戚相关,一个良好的嵌入式集成开发环境能有效的简化开发过程,降低嵌入式软件的开发难度,极大的提高嵌入式软件的开发效率,因此,嵌入式集成开发环境的发展也至关重要。SDIC-C_IDE是一款C语言的嵌入式集成开发环境,具有C语言语法高亮、换行自动缩进的功
随着建筑物内部基于位置服务需求的日益增长,面向导航服务的室内地图开发成为地图设计领域中的研究热点。在室内导航应用中,为了快速检索导航位置点的信息和获取位置点的地理坐标,需要精细化设计室内地图的数据结构;为了提高室内地图的维护效率,需要简化室内地图的编辑操作,及时更新室内地图数据。针对以上需求,以某大学办公实验楼为研究对象,以室内地图数据结构和地图绘制工具为研究重点,实现了面向导航服务的室内地图系统
COStream是一种高效的数据流编程模型,它在编译过程中基于数据流图生成可在多核上并行计算的程序,内部分析过程对用户透明,程序开发简单,但作为一种新的编程语言目前还不够完善。在编译方面,编译器内部没有完整的符号表支持,在编译过程中无法通过分析由变量控制计算节点的调用来生成静态数据流图,限制了COStream的应用场景;在程序设计方面,COStream编写嵌套数据流程序的方式复杂,不够友好。针对C
在基于匿名P2P网络的分散式存储系统中,数据所有方失去了对数据的绝对控制,而低可信的存储方随时可能篡改或删除数据,因此数据的完整性受到了严峻挑战。为了解决数据完整性难以得到有效保障的问题,数据持有性证明(Provable Da ta Possession,PDP)成为了当下学术界的讨论热点。PDP技术使得数据所有方可以在低可信的环境下通过挑战存储服务器,验证其是否正确地持有存储数据。然而,现有的P
在当前的信息时代,互联网蓬勃发展,各种知识信息爆炸性增长,人们对快速、准确地获取信息的需求促使了自动问答技术的诞生,基于自然语言的知识图谱问答系统(KBQA)正是其中的一个重要分支,它可以自动回答知识图谱中包含事实的自然语言问题,更加精准,快速且答案简洁。近年来,深度学习的方法也在KBQA中得到了广泛应用,但由于现实世界用户提问的问题多样,自然语言复杂且难以处理,现有的KBQA技术仍存在一些不足,
随着移动设备和动态网页技术的发展,智能设备中对浏览器性能需求不断提高,众多网络应用都开始大量使用JavaScript语言来为用户提供更加丰富的服务。在这样的背景下,JavaScript引擎的性能成为影响浏览器整体性能的最关键因素之一,进而影响用户的上网体验。目前,JavaScript即时编译引擎能够提升x86、ARM架构下JavaScript语言的解析速度,但该引擎尚未支持国产处理器。首先给出了J
交通运输是国之重器、强国之本。作为交通运输的一种,铁路运输凭借其成本低廉、受环境影响小等优点,已经成为人们日常出行和货物运输的重要方式。然而机车一旦发生故障,后果是难以预料的,轻则需要为其支付昂贵的维修费用,重则会造成机毁人亡的严重后果。机车的制动系统是机车的核心结构,因此针对机车制动系统开发一套满足需求的故障诊断专家系统具有重大的意义。另外,机务段工作人员在维修机车之后都会留下详细的诊断记录,在