【摘 要】
:
人机对话是人类与计算机之间进行交互的主要方式之一。其中,任务型对话系统通过与用户进行对话帮助用户完成预定任务,以其简单便捷的特点被广泛应用。自然语言理解是任务型对话系统的关键模块,其包含意图检测和语义槽填充两个任务,为后续模块提供语义理解支持。现有的对话语言理解方法大多需要收集大量领域特定的标注数据进行训练,才能达到较好的性能。然而随着对话任务场景的快速增加,往往在新领域难以获取到如此庞大的训练数
论文部分内容阅读
人机对话是人类与计算机之间进行交互的主要方式之一。其中,任务型对话系统通过与用户进行对话帮助用户完成预定任务,以其简单便捷的特点被广泛应用。自然语言理解是任务型对话系统的关键模块,其包含意图检测和语义槽填充两个任务,为后续模块提供语义理解支持。现有的对话语言理解方法大多需要收集大量领域特定的标注数据进行训练,才能达到较好的性能。然而随着对话任务场景的快速增加,往往在新领域难以获取到如此庞大的训练数据,因此仅需少量目标领域标注数据的小样本学习方法逐渐成为研究重点。而目前对话理解中的小样本学习方法发展还不够成熟,如何有效利用已有知识,在小样本场景下进行快速学习仍是对话理解模块的具有很大实际意义的挑战。本文的主要研究内容是面向小样本的任务型对话理解,提出使用标签增强与因果干预的方法解决现有问题。针对小样本情况下难以学习到意图检测和语义槽填充任务之间泛化关系的问题,提出了一个标签增强的小样本对话理解联合模型,通过在两个任务之间加入双向标签增强的门控机制,使模型能够有效地表达意图和语义槽之间的关系。在Few Joint公开数据集上的实验结果表明,该联合模型的性能相对于基线方法在各项指标上均有显著提升,并验证了基于双向标签增强门控机制的联合模型框架可以提升多种小样本学习方法的性能。针对标签增强的联合模型在源领域学习的大量知识会对模型在目标领域上学习新知识产生误导性的问题,提出了一个基于因果干预的小样本对话理解方法。通过提出小样本对话理解的结构因果模型,分析造成样本特征与类别标签之间非因果相关性的混杂因子,进而提出了一个基于后门调整的因果干预实现算法,消除混杂因子的影响,使模型能够学习到输入与输出之间真正的因果关系。通过对比实验验证了将干预算法应用于小样本对话理解模型的有效性。最后,将标签增强的小样本联合模型与因果干预算法相结合,提出了基于因果干预与标签增强的小样本对话理解联合模型,进一步提升了整体模型的语义理解能力。实验结果显示,最终的联合模型在Few Joint和Snips两个数据集5-shot设置上的语句准确率分别提升了18.20%和5.60%,达到了最佳的性能。
其他文献
目的:应用左室压力—应变环(LV–PSL)评估左室射血分数(LVEF)减低的急性ST段抬高型心肌梗死(STEMI)患者心肌做功变化,并探讨早期心肌做功参数在预测左室收缩功能变化中的临床价值,以期为临床诊疗、预后评估提供新的依据。方法:选取2020年3月—2020年12月在我院因初发急性STEMI行PCI治疗后左室射血分数(LVEF)减低的患者62例。记录所有患者住院期间的基本临床资料,包括:人口学
目的旨在建立预测甲状腺微小乳头状癌(PTMC)侵袭性的超声联合基因风险预测模型,为主动监测PTMC提供理论依据。方法选取2017年10月至2021年1月264例行手术治疗并经术后病理诊断为PTMC的患者。将2017年10月至2019年4月收集的154例纳入模型组,2019年5月至2021年1月收集的110例纳入验证组。分析模型组154例经术后病理证实为PTMC患者的临床资料、超声特征及BRAF V
研究目的研究人组织激肽释放酶结合蛋白(Kallistatin)及高迁移率组框蛋白1(High mobility group-1,HMGB-1)在间质性肺疾病(Interstitial lung disease,ILD)之中的诊断价值及临床意义。研究方法选取2021年4月-2021年7月在安徽医科大学第二附属医院就诊经高分辨率CT(High-resolution computerised tomog
目的1.探讨不同B7-H3表达水平肺腺癌患者对EGFR-TKI靶向治疗应答率的影响2.探讨共信号分子B7-H3与肺腺癌(EGFR-TKI)靶向治疗继发性耐药的相关性方法1.采用免疫组化方法检测56例肺腺癌组织B7-H3表达,将其分为低表达和高表达两个水平,并分析了B7-H3高/低表达与一线抗EGFR治疗的临床结局之间的关系。分析的主要标准为总缓解率(ORR)、疾病控制率(DCR)和无进展生存期(P
如今,人工智能正在深刻影响和改变着我们的世界,智能人机交互的发展及应用极大程度上提高了我们的生活质量。语音合成技术能赋予机器像人一样自如说话的能力,是智能人机交互中非常重要的一环。近十年,基于神经网络的语音合成系统可以更快速地合成高质量音频,逐渐成为了主流。在汉语作为母语的同时,英语也逐渐成为我们的第二语言,中英文混读现象日益常见,中英文跨语言语音合成需求越发迫切。然而,主流的语音合成模型往往仅支
近些年来,数据隐私泄露事件频发,隐私泄露造成的危害越来越大,数据隐私保护变得尤为重要。联邦学习可以在保护数据隐私的同时,挖掘数据价值。然而,标签噪声数据严重影响联邦学习模型效果,阻碍联邦学习的应用。目前联邦学习场景下的标签噪声调试研究主要是通过选择数据质量高的联邦节点或者标签正确的样本数据,来减少标签噪声对联邦模型的影响。但是,上述方法难以兼顾过滤数据集的纯度和丰度。节点选择方法没有真正识别噪声数
会话推荐算法根据已知的会话数据,对用户下一时刻可能的行为进行预测,其中会话数据指用户在Web应用上的多个点击等交互行为组成的序列数据。会话推荐算法可以使用用户的单个会话或多个历史会话来进行推荐,一般而言,都需要从用户行为信息中建模出其长期偏好(静态意图)和短期偏好(动态意图)再进行推荐。基于图神经网络的会话推荐将会话转化为会话图,并从中捕获交互项之间的复杂转移关系,从而更全面地建模用户意图。不过当
随着物联网技术的发展和全景成像技术的成熟,全景相机在商场和会展中心迅速普及,涌现出越来越多依托全景图像的视觉应用需求,例如物联网设备可以通过分析视线信息来理解人的行为和意图。目前视线方向识别的研究主要是基于眼球或人脸特征的视线估计方法,面对的大多是受控场景下的视线估计。当面对全景相机所应用的复杂非受控环境时,传统方法视线方向识别精度低,因此本文将研究面向全景图像的多行人视线方向识别,先对多行人目标
背景肺炎克雷伯菌(Klebsiella pneumoniae,KP)是在社区和医院感染中获得的最常见的革兰阴性菌,近年来,高毒力肺炎克雷伯菌(hypervirulent K.pneumoniae,hv KP)感染的发病率和死亡率持续增加。肺上皮细胞针对入侵的病原体有复杂的防御机制,其中Toll样受体(Toll like receptors TLRs)的表达可诱导激活肺上皮抗菌途径及气道炎症反应。有
目的:研究右半结肠癌淋巴结转移的相关规律,探讨淋巴结转移与右半结肠癌分化程度、肿瘤位置、浸润深度等相关因素的关系,并进行相关统计学分析,从而指导临床中右半结肠癌淋巴结相关清扫范围。方法:收集2018年9月至2021年10月在安徽医科大学第二附属医院胃肠外科就诊并实施CME右半结肠癌D3根治术手术共52例患者的临床相关资料,如年龄、性别、肿瘤大体分型、肿瘤浸润深度(T分期)、术前血CEA(carin