【摘 要】
:
近年来,随着计算机计算能力的飞速提升以及大规模可用数据的出现,人工智能技术得到了大踏步的发展。其中,对话系统作为人工智能中重要分支--自然语言处理(Natural Language Processing,NLP)的主要研究方向之一,也逐渐受到学界和产业界的关注并成为当前的研究热点。目前,针对对话系统的研究虽然取得了一定的进展并将相应的技术成果应用于客服对话、法律咨询、虚拟助手等实际场景中,但是仍然
论文部分内容阅读
近年来,随着计算机计算能力的飞速提升以及大规模可用数据的出现,人工智能技术得到了大踏步的发展。其中,对话系统作为人工智能中重要分支--自然语言处理(Natural Language Processing,NLP)的主要研究方向之一,也逐渐受到学界和产业界的关注并成为当前的研究热点。目前,针对对话系统的研究虽然取得了一定的进展并将相应的技术成果应用于客服对话、法律咨询、虚拟助手等实际场景中,但是仍然面对着来自数据、算法、优化等方面的挑战。本文主要就闲聊对话系统生成回复的角色一致性和多样性展开研究。对于人类来说,在日常生活中基于自己的个人特点进行有趣多样的交流是十分自然而然的事情,但是这对于一般的对话系统来说却是十分具有挑战性的事情。目前,已有的对话系统模型很难在生成多样性回复的要求下还能很好的维护给定的角色信息,它们大都只是针对回复多样性和角色一致性其中之一进行研究,但是这对于日常中的对话系统来说,回复缺乏角色一致性会降低系统可信度而缺乏多样性则会影响人机交互的趣味性以及可持续性。因此,本研究同时考虑提高回复的角色一致性和多样性。研究内容具体包括以下几个方面:(1)探究回复多样性研究和角色一致性研究的有机结合方法:单纯依靠单一端到端的模型很难实现多样性和一致性表现的统一。本文从多级回复生成模型出发提出了两级回复生成框架,在回复多样性和角色一致性两者之间起到了衔接的作用,在此框架下我们最终提出的回复生成模型成功实现了同时提高回复的多样性和角色信息一致性。(2)探究回复多样性提升方法:首先,通过对已有多样性提升方法的对比分析并结合本研究的具体需求,我们选择基于条件变分自编码器(CVAE)的方法作为本研究中回复多样性建模的基本方法。然后,我们针对该类方法最新的模型在回复角色信息一致性上的不足,提出了在角色信息引导下的多样性回复生成模型。该模型通过将当前对话用到的角色信息作为先验知识参与隐变量的编码,以增强模型对不同回复中角色信息的感知,这有利于隐变量在给定角色条件下对多样性回复的建模。(3)探究角色一致性提升方法:为进一步提高多样回复的角色一致性,我们在两阶段回复生成框架(Two-stage Response Generation Framework)下,提出了新的角色一致性检测及改写模块,即利用预训练模型BERT对生成回复的角色一致性进行检测并标记出不一致的单词,再结合指针生成网络通过二次解码将不一致的地方进行重写,得到最终的角色一致性和多样性兼顾的输出回复。我们使用客观和主观评价指标相结合的方式对提出模型的表现进行评测。实验表明,我们提出的模型不仅继承了原有基线模型在多样性上的优势还明显的提高了回复的角色一致性,证明我们提出的方法是有效的。
其他文献
随着5G和AI快速发展,芯片半导体行业持续走高,国内芯片市场和需求急速膨胀,但由于我国芯片自给率低,加之美国对我国的芯片制造技术的制裁,我国芯片半导体国产化迫在眉睫。随之而来的是更多芯片洁净厂房的建造和产能提升,也就意味着巨大的能源消耗提升,其中洁净厂房空调能耗是常规公共建筑的数十倍以上,而目前国内针对此类建筑的能耗分析和节能评价方法处于空白阶段,因此研究芯片洁净厂房空调系统节能运行评价对指导约束
广东省失业保险基金自运行以来,在保障失业人员生活等方面发挥着重要作用。随着广东省经济结构的不断调整,失业保险基金运行效率未随着当地经济发展水平的提高而提高,因此,仍需对基金实际运行情况进行深入研究,以更好地发挥其作用,促进社会保障制度的进一步完善。本文从广东省失业保险基金运行效率现状出发,对基金运行机制、基金运行效率现状等方面展开研究,总结当前基金运行存在问题,并结合相关数据,对基金运行效率进行评
伴随着通信技术的高速发展,迫切要求无线通信设备不断地改进更新。大容量、低时延、高可靠性正成为无线通信设备的发展趋势。天线作为射频前端重要组成部分也逐渐朝着规模化、阵列化、多功能化发展,以适应日益复杂的通信系统需求。然而在空间有限的资源条件下,当天线尺寸大幅度减小时,天线的辐射性能也随之下降,并且天线阵列的阵元间距进一步缩减,强烈的阵元间耦合也会使得阵列性能恶化。因此,发展适合于有限空间的天线单元及
在移动互联网迅猛发展的今天,网络上每天产生的大量非结构化数据需要命名实体识别等信息抽取技术去提取其中的有效信息。命名实体识别(Named entity recognition,NER)任务的目的是识别出文本数据中特定类型的实体名称,其识别结果影响着关系抽取、文本理解、自动问答等下游自然语言处理任务的效果,因此具有非常重要的研究价值和意义。深度学习理论和技术的发展推动着命名实体识别的进步,已有研究表
目的:比较15个院前卒中严重程度量表对大血管闭塞性卒中(Large Vessel Occlusion Stroke,LVOS)的预测价值,筛选出能准确、敏感且便捷地预测LVOS的最佳量表,为LVOS的早期识别和患者转运提供参考依据。方法:连续性收集2017.01至2020.01于我科住院的急性缺血性脑卒中患者。入组患者需满足入排标准。收集患者的临床和影像学资料。计算纳入患者的NIHSS、sNIHS
古旧建筑要再利用起来,必须满足安全承重、防火、抗震等基本安全性能要求。首先对江南民居的传统营造工艺进行研究,归纳共性问题。其次对一幢绍兴传统民宅进行了实地测绘与结构分析,揭示结构的传力路径。基于保持原有风貌的原则,设计、研究出现实可行的再利用加固改修方法。本文研究对象是未列入文物的民间传统民居,符合鼓励“非重要文物不必冻结保护,活化利用起来更有利于保护,使特色风貌保持的更长久。”开展了以下工作:(
大型曲轴是内燃机中承载和传递动力的关键零件,高速运转中不但承受着交变应力,而且传递着大扭矩,这就要求大型曲轴应具备良好的机械性能来保证其在使用过程中正常工作。大型曲轴锻造容易出现成形质量差、填充不满、材料利用率低等问题,根据传统的经验设计和工厂的实际工况,同类曲轴锻造时材料利用率约为65%~75%。因此本文以某大型曲轴为研究对象,基于有限元模拟分析,建立1MJ对击锤模锻有限元模型,模拟该大型曲轴的
近些年来,我国逐步迈进老龄化时代,老龄人口比重不断增加。据2019年国家统计局第七次数据显示,我国60岁以上老龄人口占人口总数的18.1%,较2018年增加了439万人,而最近五年社会保险基金收入支出比却呈现出渐进式的下降,2019年首次低于1.1倍,基本养老保险替代率已低于50%。未来,我国需要提供养老基金支持的人数与养老基金池的异向发展,会使社会和家庭相互支撑的养老压力逐步显现。影响居民或家庭
随着我国汽车保有量的增加,停车需求越来越大。室内停车场作为城市主要停车场景之一,该场景下出现了“停车难”和“寻车难”的问题,实时高精度的车辆定位和可视化停车地图成为解决该问题的有效途径。为实现车辆的精确定位,车辆需要搭载高精度传感器和大幅改造定位场景,成本高,难度大。室内停车场中,由于现有车辆定位方法易受环境噪声干扰,系统整体定位精度也不高,严重影响车辆的精准定位。同时,大多数用于车辆定位所构建的
公安民警在维护社会治安稳定、抢险救灾、便民服务、节庆安保等诸多工作中发挥了重要的职能作用,做出了突出的贡献。长期以来,在加强公安队伍建设方面强调从严治警,重视队伍执法能力和素质的建设,而从优待警的提出弥补了当前公安队伍管理上的缺陷,为公安队伍的建设注入新的活力。从实际情况看,“从优待警”的口号很响亮,但政策的执行存在严重的滞后性,并未达到预期的效果,难以真正激发公安民警的内在潜能,不利于公安队伍建