【摘 要】
:
口语理解是对话系统重要的功能模块,口语理解的性能直接影响后续的对话管理,意图识别和语义槽填充是口语理解的两个关键子任务。本研究主要针对对话系统中的口语理解进行研究。传统方法中,意图识别和语义槽填充独立解决,独立建模没有考虑两个任务的相关性,但是这两个任务相互关联,因此现阶段大多数研究者将意图识别和语义槽填充任务使用同一个模型联合解决,这样既可以将模型学习到的特征被两个任务共享,同时将意图识别和语义
论文部分内容阅读
口语理解是对话系统重要的功能模块,口语理解的性能直接影响后续的对话管理,意图识别和语义槽填充是口语理解的两个关键子任务。本研究主要针对对话系统中的口语理解进行研究。传统方法中,意图识别和语义槽填充独立解决,独立建模没有考虑两个任务的相关性,但是这两个任务相互关联,因此现阶段大多数研究者将意图识别和语义槽填充任务使用同一个模型联合解决,这样既可以将模型学习到的特征被两个任务共享,同时将意图识别和语义槽填充的结果使用一个模型输出,对于后续的对话管理可以减少误差累积。本文在联合建模的基础上进行改进。本文的工作包含两个任务的独立建模研究和融合多种方法的联合建模研究。本文的具体工作如下:(1)两个任务的独立建模研究。由于支持向量机(Support Vector Machine,SVM)在意图识别任务中效果比较好,因此本文采用SVM对意图识别进行独立建模研究,并采用深度学习模型卷积神经网络(Convolutional Neural Network,CNN)、双向门控循环单元(Bidirectional Gated Recurrent Unit,BiGRU)以及CNN-BiGRU模型对意图识别进行研究。语义槽填充任务类似于命名实体识别任务,通常采用序列标注的方法解决,条件随机场(Conditional Random Fields,CRF)在命名实体识别任务中效果显著,本文采用CRF对语义槽填充进行独立建模研究,并将口语理解独立建模的结果与提出的融合多种方法的联合识别模型进行对比。(2)提出一种融合多种方法的联合识别模型对意图和语义槽填充联合建模,达到优化语义框架的目的。第一,采用深度学习模型双向长短时记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)获取上下文语义语法特征。第二,对两个任务加入注意力机制克服BiLSTM不能对输入序列聚焦学习的缺陷,进而达到不同时刻对所有输入序列的聚焦式学习,更好地获取输入的特征信息。第三,由于意图识别的结果对语义槽填充任务具有积极作用,采用语义槽门控slot-gated机制将意图识别的结果作用于语义槽填充任务。第四,考虑到语义槽填充任务标签前后具有依赖关系,深度学习模型提取特征后,在语义槽填充任务中采用CRF作为解码模型。本文在两个数据集上进行实验,将提出的融合多种方法的联合识别模型与两个任务的独立模型以及其它联合识别模型进行对比。实验结果表明,本文的实验模型优于其它模型,证明了意图识别的结果对于语义槽填充的积极作用,结合统计模型可以考虑到标签序列前后的相互依赖关系,对于后续对话系统的研究具有重要意义。
其他文献
在资本市场不断发展的现在,呼吁赴外上市的独角兽企业重返中国证券市场的呼声与日俱增。由于存在VIE结构,AB股票以及这些公司在境外注册的事实,所以,这些公司并不符合国内发
为了便于为客户提供更专业全面的服务,德科公司在全国42个城市设置督导岗位,负责客户门店管理工作。整个督导团队由于建立初期组建匆忙,同时各地区较为分散,随着公司业务不断扩展,各地区督导在工作能力上的欠缺也逐渐体现,作为直接接触客户的终端人员,督导团队水平直接影响客户满意度,公司想要开发扩展更多的业务,客户需要更全面完善的管理服务,随着对督导团队的工作要求越来越高,目前培训管理方案已无法满足督导团队的
马克思的著作中包含着丰富的生态思想,其中,对资本主义工业的生态批判,是马克思生态思想的重要组成部分。研究马克思对资本主义工业的生态批判思想,不仅对全面了解马克思的生态思想以及马克思的社会批判思想具有重要的理论意义,而且对深刻认识资本主义工业革命带来的生态恶果、资本主义的本质以及资本主义的未来走向都具有重要的现实意义。十八世纪发生的工业革命有力推动了人类社会的发展进步,尤其是使资本主义的生产力得到了
随着学术交流的国际化程度日益增强,学术论文的英译需求也逐渐增多,尤其是论文摘要的英译。本报告基于作者社会科学类研究论文摘要的汉译英实践完成。译者在校期间从翻译公司接收了大量的翻译任务。其中,论文摘要的英译占据了很大一部分。在此翻译实践中,译者从本人有关摘要的翻译实践中选取了28篇、共计一万余字(中文)的论文摘要翻译作为本次报告的材料,主要涉及教育、历史、文学、民俗等领域。在翻译过程中,报告描述了翻
体育赛事法律保护近年成为学界研究的热点之一,相关司法诉讼也引发热议。纵观相关文献和案例,大多是针对体育赛事节目的法律性质展开分析,而忽视了对体育赛事活动的探讨。事实上,体育赛事活动天然具有表演者权的表象,而反过来表演者权也足以涵盖赛事组织者和传播者的利益诉求。基于此,本文研究的问题为:以表演者权保护体育赛事活动作为体育赛事法律保护路径的合理性与可行性。本文首先通过实证研究指出我国体育赛事法律保护的
代码注释(Code Comment)即用自然语言的形式论述代码背后实现的逻辑或功能,开发人员通过代码注释来认识掌握软件仓库中源代码描写的功能。软件开发随着互联网的迅猛发展也在不断高速发展,并伴随出现了大量的开源代码库。在软件开发过程中阅读并理解开源社区的源代码是一项耗时耗力的工作,如果源代码有相应的功能描述性注释,很大程度上简化并加快软件开发过程及速度,同时完善的代码注释也可以提高软件系统的可维护
烟曲霉(Aspergillus fumigatus)是一种环境中常见的、以空气传播方式感染的机会性致病菌。临床上主要感染免疫力低下患者的肺部,并可能侵袭体内其他器官组织。近年来,随着国内人口老龄化数量不断加大以及各种抗真菌的药物滥用,导致免疫力低下的人群数量急剧增加,从而使临床因烟曲霉深部感染患者数量已经占据深部真菌感染数量的第二位。对人类生命健康的威胁正逐步加剧。本研究利用前期实验室成熟的烟曲霉
二十世纪七十年代以来,各个新制度主义流派不断推进自身理论构建与方法更新,理性选择制度主义、历史制度主义、社会学制度主义与建构制度主义等研究分支分别产生了斐然的研究成果与理论工具。作为政治科学领域的重要分析范式,新制度主义在解释制度现象时,关注到行动者、制度背景与各类结构要素的互动,有效弥补与修正了主流社会科学研究范式的不足与局限。然而制度现象纷繁复杂,行动者、制度背景与结构性要素在现实政治运转中均
改革开放以来,私营企业取得了空前的发展,私人财富得以不断积累,高净值人群规模也不断增加。这使得家族信托面临极大发展机遇,但我国现行相关信托制度的缺陷也逐渐暴露。与其
随着医疗条件的改善和生活水平的提高,人们的平均寿命提高,导致老年人口数量增加。依据联合国年龄标准,截止到2018年末我国的老年人口数量达到约2.5亿人,人口老龄化形势严峻。其中失能和半失能老年人口比例达到老年人口数量的16%,这些失能和半失能老年人口的照料问题成为亟待解决的重要问题。目前我国的社会养老资源开发有限,而且受传统养老观念的影响,家庭照料一直是老年人口照料的主要模式。本文主要是对家庭老年