面向自然语言理解的新槽值问题研究与应用

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:zhb_lzh_X
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言理解模块是任务型人机对话系统的重要组成部分,一般包含领域识别、意图识别与语义标注三个部分,语义标注识别用户输入中的槽值,也常称为槽填充,是自然语言理解的主要任务。在很多实际应用中,NLU不仅需要语义标注算法识别出用户输入中的槽值,还需要将槽值映射到一个预定义(或基于训练语料构建)的槽值列表上。但是,预定义的表难以包含所有可能槽值,实际对话中常常会出现不在列表(或训练语料)中的新槽值。有效识别新槽值对于自然语言理解的健壮性和对话系统的扩展性都具有重要价值,但是,传统的基于序列标注的方法以及基于分类的方法都无法有效地解决这一新槽值问题。本文针对上述问题,在充分调研已有相关研究的基础上,结合实际需求开展工作,具体内容包括:提出了一种基于注意力机制的联合语义标注模型以及基于负采样的模型训练方法。模型结合序列标注器与分类器,序列标注器定位槽值信息而分类器获得标准槽值或新槽值类别标签·,基于负采样的训练方法通过构建负样例使得模型可以进行监督训练。在两个语料的实验结果表明,基于负样例的训练显著提升了新槽值识别的性能,而注意力机制可以自主发现关键信息,进一步提升了模型性能。对联合模型进行了扩展研究,尝试了多种建模多字符槽值内部关联的方法,包括添加文本特征、改进注意力机制、文本语义结构表示,并进行了同时有多个槽情形下的槽值识别探索。实验结果表明,本模型可以成功迁移至多槽的应用情景,识别每一个槽中的新槽值。基于上述技术,实现了一个完整的自然语言理解模块,应用于某企业手机售后客服人机对话系统。对模块的功能测评表明,该模块能够成功识别标准槽值与新槽值,在实际应用过程中表现出了良好的性能。
其他文献
预测是指对复杂变化的事物进行大量调查研究,应用系统分析的方法找出事物发生变化的固有规律,揭示事物未来的状况和面貌。影响服装制造厂物流需求的因素很多,可以用多元线性
于2013~2014年,以样带法系统地调查了位于湖北荆州市的长江大学校园鸟类资源,总共记录到13目34科89种鸟类。其中,国家二级重点保护鸟类10种(11.2%)、"三有鸟类"(国家保护的有
<正>声带疾病直接影响声音,且病因复杂、表现形式多样,或嘶或哑,或调高不下或低沉难升,或断绪不连贯等等,给患者带来诸多不便及痛苦,甚至危及生命。本文就我科近年诊治的406
<正>前列腺癌(prostate cancer)是男性生殖系最常见的恶性肿瘤之一,发病随年龄的增长而增加,其发病率有明显的地区差异,占男性癌症死亡的第二位[1]。目前,前列腺癌的病因尚未
目的:探讨输尿管末端囊肿的诊断与微创治疗方法。方法:回顾性分析医院2005年至2012年收治的18例输尿管末端囊肿的诊断及治疗。18例患者术前均行CT尿路造影(CTU)检查明确诊断,
针对相控阵雷达任务调度问题,该文提出了一种基于动态时间窗的任务调度方法。该方法根据目标跟踪滤波中的残差和雷达对目标跟踪波门之间的约束关系以及搜索帧周期的约束,分别
细胞穿膜肽(CPP)是具有穿透多种细胞膜功能的小分子多肽,能携带生物活性大分子物质进入细胞。由于CPP缺乏组织选择性和靶向性,限制了其在肿瘤治疗领域的应用。可活化细胞穿膜
2016年第17号台风“鲇鱼”正面袭击福建省,并于9月26~29日期间给福建带来了严重的风雨灾害,尤其是大风带来的破坏影响非常严重。该文对1617“鲇鱼”台风大风的成因进行分析,
目的探讨不同分期胃癌患者多层螺旋CT灌注参数与血清血管内皮生长因子之间的关系。方法依据TNM分期和病理分期,选择我院2011年10月至2012年10月收治的胃癌患者67例,分为胃癌
采用离子交换工艺,对湿法炼锌酸浸渣中的水溶性锌进行富集回收中试试验。工艺过程包括酸浸渣水浸和压滤洗涤、低浓度含锌溶液离子交换吸附解吸和转型、尾水循环利用等过程。