基于文本表征和小样本学习的对话意图识别的研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:pingguotailang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展,人机交互对话系统越来越受欢迎,其中意图识别模块受到越来越多的关注。目前,意图识别方法大多使用有监督的方式进行编码,而现实生活中的标注数据往往较少、人工标注成本也较高。针对无标注、小样本数据,如何通过无监督的方式来解决意图识别问题,是当前自然语言处理领域一个热点问题。本研究通过有效的文本表征和小样本学习,来解决电子商务客户服务对话意图识别问题。本文基于某电商平台真实对话数据,结合文本表征和小样本学习方法,通过引入对比学习来解决无监督下正负样本缺失的情况以改进意图识别模型,应用到电商平台对话系统中,实现用户意图识别准确率的提高。首先,采用两阶段(TF-IDF-m RMR)特征词筛选方法,过滤出对意图有帮助的特征词,以避免特征词之间存在信息冗余;实验结果反映出通过特征词筛选能使得模型识别精度提升1个百分点。然后,使用BERT作为意图识别的文本表征器,并采用对比学习的方式做无监督训练,以充分利用无标注数据作为先验信息,从而实现文本向量表征;通过对比目前流行的编码器如DPCNN,Text CNN,Text RCNN,Text RNN,Attention和Transformer模型,发现召回率、精确率以及F1值平均提升2个百分点。最后,采用度量学习的框架构建小样本意图识别模型,基于前述文本表征作为框架中的编码器,使用归纳网络和关系网络作为打分器,通过参数学习优化样本和类别表示的距离建立整体模型,得到性能良好的意图识别模型;通过同Bi LSTMAttention和RNN-LSTM等其他意图识别模型进行对比,发现所构建的意图识别模型的精确率能提高3个百分点。本文通过数据处理、模型构建以及对比实验,验证了基于文本表征和小样本学习的对话意图识别的有效性,拓展了小样本学习任务的应用场景。
其他文献
介绍一种竖井掘进机功能及应用,根据传统竖井施工工法进行改革,提出全断面掘进、竖井管片同步跟进一次成井的新工法,大大提高竖井施工效率及安全可靠性。该掘进机已在多个地区进行成功运用,总结出一套成熟的掘进机施工体系,为整个竖井行业施工提供可靠的工法,并大大提高了竖井掘进机机械化推广进程。
现行公路和城市道路规范对软土区路桥过渡段的质量要求主要基于道路等级确定路基的容许工后沉降,在质量控制时未充分考虑公路与城市道路设计速度的影响,未明确路桥过渡段长度及渐变率,也未明确桥台处错台高度,导致部分软土区路桥过渡段出现陡坡型、错台型等影响行车安全的病害形式。结合路桥过渡段安全性、舒适性及车路协同研究成果,分析了公路和城市道路各等级道路与设计速度的关系,并对设计速度进行定档分级,提出基于设计速
为了减少聋哑人与正常人交流的障碍,让聋哑人能更好地表达自己的想法和情感,提出了一种无障碍交流辅助系统并提出终端设备的设计策略。该系统利用手势识别技术采集手语动作,利用情感识别技术采集实时情感,利用语音和增强现实技术进行信息输出,同时利用情感化设计的方法对系统和设备进行优化,以帮助聋哑人更好地融入社会。
核心素养是指学生在接受教育的过程中逐渐形成的适合终身发展的关键能力。在初中数学教学中,学生的核心素养是指学生的思想品质与数学综合能力,是新课改对数学教学的需求,同时也是社会现代化发展中对人才的要求。新课标中指出初中数学教学不仅要关注学生的知识技能,同时要关注学生情感态度与价值观的发展,促进学生综合素养的提升。采用何种教学策略与教学方法,是初中数学教学中教师保证数学核心素养理念落实的关键。本文针对数
针对健康问题突出、环境亟待优化的老旧单位社区,综合考虑可测量的建成环境、建成环境的健康影响要素和单位社区建成环境,为老旧小区评估建成环境对居民健康的影响、更新改造工作提供研究依据,以及国家健康战略在基层的落实。选取土地利用、道路交通、空间设施和综合指数四个健康影响要素,以成都三个典型案例为实证,进行要素评估。研究发现在不同更新改造阶段,仍存在共通现状问题:(1)土地利用混合度较高,容积率较为适宜,
新冠肺炎疫情暴发以来,地方财政在“六稳”“六保”下刚性支出增加又增收乏力,不得不大幅增发债券弥补收支缺口,导致地方政府债务可持续性面临更大挑战。本文先应用跨期预算约束方程,通过调整GDP增速和财政收支参数,设定突发性和持续性压力情景,评估了地方财政可持续风险及关键影响因素。在此基础上,进一步运用DEA模型评估了我国30个省(自治区、直辖市,不含港澳台及西藏自治区)地方债支出效率。研究发现:一是无论
本文基于2011—2020年中国30个省区的面板数据,实证研究数字经济对制造业优化升级的异质性影响、作用机制及其非线性特征。结果表明:总体上,数字经济能够明显促进中国制造业优化升级;区域异质性检验表明,数字经济有助于各地区制造业高级化发展,对东部和西部地区制造业合理化的影响显著为正,对中部地区的影响不显著;行业异质性检验表明,数字经济对技术密集型制造业的促进作用最大,资本密集型制造业次之,对劳动密
随着时代的不断发展,现阶段的引水工程具体实施得到了广泛的关注。文章以新疆奎屯河引水工程新龙口电站为例,详细介绍了该项目的基本情况及隧洞布置方案,通过咨询确定了采用一次衬砌和二次衬砌联合承受外力的模型,后进行了结构设计和稳定性分析,通过比选得出最佳的施工技术方案为采用开挖、砌壁混合作业方式施工技术。研究对于项目的顺利建成具有指导意义,有助于提升电站竖井施工质量及效能。
<正>千呼万唤始出来的《义务教育艺术课程标准(2022年版)》(以下简称“艺术新课标”)完全颠覆笔者之前对课标的猜想。首先,美术教育不再孤立存在。艺术新课标统领音乐、美术、舞蹈、戏剧(含戏曲)、影视(含数字媒体艺术)五个学科的内容,以艺术素养关联学习内容,拓展教育视野,凸显其综合性和前瞻性。其次,关注中小学生的艺术素养发展。正如崔允漷教授所说,
期刊