基于DQN的开放域多轮对话策略学习

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:damitanqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有效地进行多轮对话是开放域人机对话系统的主要目标之一。目前的神经网络对话生成模型在开放域多轮对话过程中存在着容易产生万能回复、很快陷入死循环的问题;而已有的多轮对话研究工作存在着没有考虑未来对话走向的问题。借鉴强化学习方法考虑全局的视角,该文利用深度强化学习算法DQN(deep Q-network),提出了使用深度价值网络对每一轮的候选句子进行评估,并选择未来收益最大的而非生成概率最大的句子作为回复的多轮对话策略学习方法。实验结果表明,该文提出的方法将多轮对话的平均对话轮数提高了两轮,同时在主观对比评价指标上获胜比例高出了45%。
其他文献
[目的]探讨三七皂苷R1对人白血病细胞株HL-60细胞凋亡作用及其机制。[方法]光镜下观察三七皂苷R1作用下HL-60细胞形态,采用MTT比色法观察三七皂苷R1对人白血病细胞株HL-60细
蓝藻水华是国内外富营养化水体中最常见的水环境问题。防治蓝藻水华的产生是一项长期常态化管理重任。综述了蓝藻水华的严重危害性;分析了太原市汾河景区水段蓝藻水华形成的
企业在进行财务报告分析时,明确关联方关系及交易的类型与性质,从而剖析关联方利用交易价格、所得税、管理费收取、无形资产交易等手段,来粉饰财务状况和经营成果提供虚假财
目的观察个体化训练模式应用于脊柱患者术后的康复影响分析。方法选取2016年5月~2017年5月收治的脊柱伤患者94例作为研究对象,将其随机分为两组,对照组采取常规训练,实验组进
阳泉市是山西省最为缺水的地区之一,阳泉市的水资源在时间和空间的分布上不均,水污染问题严重,有限的水资源难以持续开发和利用。为实现水资源的可持续开发利用以及经济的高质量发展,需要进行水资源合理规划、配置、调度。精准的预测用水量是解决与水资源相关问题的前提。针对阳泉市基本用水情况,建立阳泉市水资源的DPSIR模型,从驱动力、压力、状态、影响、响应五个准则层对影响阳泉市用水量以及水资源可持续利用的指标因
实验教学中主要传统的教学方法以验证型实验教学为主,学生兴趣不大、本文对机械基础实验教学进行了一定的改革探讨,让学生学会动手能力及创新精神,使实验教学质量有明显提高
本文运用组织变革的理论,通过对高职护理人才培养模式变革的过程分析,发现在变革过程中存在的问题,为进一步调整变革的方案和策略做好准备。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
实行自主招生是高等职业教育进行招生改革的一项重要内容。构建质量保证体系是切实提高自主招生质量的重要途径。本文以浙江省为例,通过对自主招生现状与存在问题的分析,提出
新会计准则中关于资产减值的相关规定对于提高企业财务信息质量具有重要意义,特别是新准则引入了资产组概念、公允价值的使用、资产减值损失可否转回等规定都将对企业产生重