基于深度学习的对话领域意图分类方法研究

来源 :河北科技大学 | 被引量 : 0次 | 上传用户:lxwhuochai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展以及智能手机的普及,对话系统的发展进入了重要的历史阶段。意图分类是自然语言理解(NLU)系统中的一项重要任务。本文从单轮对话句子级意图分类和多轮对话文档级意图分类的角度进行了进一步研究和探索。在单轮对话意图分类方面,近年来,一些模型开始联合处理意图分类和填槽任务。但是,大多数的联合模型需要大量人工标注的槽位数据样本。因此,本文提出了意图分类和命名实体识别的联合模型。本文使用工业强度的自然语言处理工具spaCy为基准数据集生成命名实体标签,不需要人工标注命名实体识别标签。该模型可以在命名实体标签中学习到更多的语义信息,进而提高模型在意图分类任务上的性能。命名实体识别的标签体系相比于填槽的标签体系具有更高的通用性,相同的命名实体标注标准可用于许多不同的领域和意图。在三个基准数据集上,意图分类和命名实体识别的联合模型实现了比意图分类和填槽的联合模型更好或相似的性能。在许多实际场景中,用户可能需要与系统进行多轮对话才能够使系统正确的完成一个任务。也就是说,在多轮对话中,有时用户的真实意图只有一个,也可以将此意图称为原始意图或真实意图。因此,文本在多轮对话中提出了文档级意图分类任务,用于检测用户在多轮对话中的原始意图。参考哈尔滨工业大学整理的标签体系,本文对Stanford&Ford In-car-assistant数据集中的意图进行二次标注,将意图数量从3个增加到21个。在多轮对话文档级意图分类任务的中,文本探索了层次化双向LSTM和非层次化双向LSTM模型的不同性能,并提出了一种层次化自注意力模型。实验证明,与单轮意图分类模型相比,层次化自注意力模型获得了有竞争力的结果。
其他文献
郑板桥一生与僧人多有亲近,尤“喜与禅宗尊宿……游”,广结善缘使郑板桥加深了对佛学的理解并直接影响到他的人生态度,研究郑板桥很有必要对其交往的方外友有所探讨和研究。
当前,产业地产的势头正旺,同时也存在着许多招商误区。比如,把产业地产招商等同于住宅和商业地产的广告式营销;一味强调卖产品,而忽视产业环境、生产要素、运作理念和服务平
中美贸易摩擦的舆论风险的特点在于有两个舆论空间和两个舆论场、舆论参与主体多元化、舆论观点的多样性,影响着中美贸易争端的解决.通过对中美贸易摩擦的舆论博弈形势的分析
减轻日常家务劳动,寻找专业的洗染公司,提升生活水准,已成为多数人的选择。然而,洗染行业竞争激烈,传统洗染行业同质化严重,低档次、低水平、重复竞争的业务模式制约了国内洗
近年来新零售的发展使线上线下合作日益密切,许多零售行业的上市公司引进战略投资者增强自身实力,以争得在市场中的一席之地。然而引进战略投资者的交易方式众多,如定向增发
室内分布系统可以改善室内的通信环境,提高通话质量,所以移动通信室内分布系统的设计至关重要,本文主要深入探讨了移动通信室内分布系统设计,希望能够为相关工作者提供借鉴。
国内非寿险市场70%以上都是车险业务,因此车险费率厘定的研究对于整个非寿险行业具有重要的理论及现实意义。索赔频率作为车险费率厘定的重要环节,在整个费率厘定过程中必不可少。一方面,传统车险索赔频率问题的研究主要基于广义线性模型,该方法忽略了解释变量之间的交互作用;另一方面,车联网时代的到来,使得历史索赔数据在传统从车、从人信息的基础上,增加了驾驶者行为数据,导致建模数据的维度及数量级产生了本质性提高
自最低工资制度实施以来,最低工资制度的就业效应就是学术界最富争议的研究主题之一。支持者认为最低工资制度对就业有正向作用,保护劳动者合法权益,缩小收入差距,提高企业生
从人类起源至现代社会的发展过程中,人的发展问题一直是人们不断探索和思考的焦点。当历史车轮将人类拖入21世纪,现代人发展呈现出的多样性和独特性,越来越备受关注,而与之相
目的:总结腹外疝手术治疗的护理经验。方法:对42例腹外疝手术治疗患者进行术前、术后护理和健康指导。结果:42例均痊愈出院,切口Ⅰ期愈合、未发生并发症,术后住院时间平均(9.82&#177