基于神经主题扩展的非结构化个性信息引导的对话生成研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:snake_icy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展,作为自然语言处理的核心任务之一的对话系统受到越来越多学者和专家的重视。近年来,智能客服、聊天机器人等智能产品繁荣发展,也体现出人们在实际生活中对智能对话系统的需求。对话系统可以分为以完成具体任务为目的的任务导向型对话系统和提供闲聊服务的非任务导向型对话系统(也叫开放域对话对话系统)。为了使机器像人一样在聊天中保持个性一致,个性信息引导的对话系统开始出现。个性信息可以分为键值对表示的结构化个性信息和自然语句描述的非结构化个性信息,其中非结构化个性信息机器更难理解和处理。非结构化个性信息引导的对话生成系统通过使用预定义的自然语言描述的个性信息(例如,“我是一个素食主义者”),在生成的回复中有效地保持了个性一致性。然而,预定义的个性信息描述通常很短,并且仅限于几个描述性词汇,这使得将它们与对话联系起来的难度很大。因为这个原因,现有的方法要么难以将个性化信息融入到回复中,要么是在生成个性一致回复的时候过度使用个性信息,导致其使用不恰当。为了解决这个问题,本文通过分析人得到高质量回复的思考过程,提出了一个神经主题扩展框架,即个性化信息的扩展和应用(PEE),它能够通过语义相关性来扩展预定义的用户个性信息,然后利用原来的和扩展的个性化信息一起生成个性化回复。PEE模型包括两个阶段:个性化信息的扩展阶段和个性化信息应用阶段。个性化信息扩展部分,模型使用基于变分自编码(VAE)的主题模型对已有的对话语料库进行挖掘和相关搜索,以此来学习扩展预定义的个性化信息。个性化信息应用部分,模型通过使用预定义和扩展的两种个性信息来学习生成个性一致的回复。个性化信息应用包括多源序列编码器、个性化信息检索和个性化引导的回复解码器三部分。此外,为了使模型在个性信息应用部分能够更准确地学习到如何使用个性化信息,本文还设计了两个个性引导的损失函数:个性化引导的匹配(P-Match)损失函数和个性化引导的词袋(P-BoWs)损失函数,他们分别在个性化信息检索和解码器中监督个性化信息的选择。本文在数据集persona-chat上进行了大量实验,此外还引入一个额外的数据集用于主题模型。本文模型PEE与现有的主流模型在自动指标和人工指标上都有显著的提升。本文在消融实验中分析了个性化信息扩展以及两个个性化信息引导的损失函数的在模型中的作用。此外,本文还通过个性信息利用率实验和实例分析验证了个性化信息的作用,尤其是解码器中互增强多跳记忆检索机制中的作用。
其他文献
“甲蹉”是摩梭人流传最广、最具代表性的传统舞蹈形式。“甲蹉”舞蹈内容丰富,涵盖了摩梭人生活的方方面面,是记录摩梭人历史的“活化石”。本论文以舞蹈生态学的研究视角,提炼“甲蹉”舞蹈“优质基因”,突出其舞蹈文化的根性特征,将“甲蹉”舞蹈风格特点归纳为“摇摆之洒脱、搓踩之质朴、挺拔之自信”三个方面;运用形态分析法,由外及里,使教学组合内容兼顾传统和创新,起到沟通民间与舞台的作用;以“文化比较”的视角,纵
学位
随着网络购物的普及,面对琳琅满目的商品,消费者愈发感到难以取舍,网络测评作为新兴产业应运而生。测评主体以视频、文章等方式对若干商品作出评价,为消费者提供消费建议,以回应网络消费时代的现实需求。网络测评关系消费者、测评主体与被测评主体等主体的切身利益,目前对其规制虽有司法诉讼、行政监管、行业自律等几种路径,但仍存在完善空间。应当拓展规制路径,健全投诉监督机制与公益诉讼机制,加强消费者权益保护;明确相
期刊
布朗族——大自然孕育的民族,是云南省世居民族之一。在其所处的地域环境、人文风貌及社会生活的影响下,布朗族人民创造了风格独特的布朗族民间舞蹈。它将肢体语汇作为载体来展现布朗族舞蹈的魅力,传递其民族情感与精神,体现其民族文化心理。本文以布朗族民间舞蹈作为研究方向,从萃取民间舞蹈中的代表性元素、运用重构创新表现形式及音乐编舞法促进舞蹈与音乐的内在关联,以此实现对布朗族民间舞蹈“宰蹦”“蜂桶鼓舞”“蜡条舞
学位
<正>一、引言洞庭湖生态经济区涵盖共33个县(市、区),总体规划面积约为6.05万km~2,市级地区囊括湖南省的岳阳、益阳、常德3市,以及湖北省荆州市,其中湖南省内面积4.68万km~2,共25个县市区。作为长江中下游的重要生态屏障,洞庭湖生态经济区肩负着维护长江流域防洪安全、保护水生态安全以及维持国家粮食安全的艰巨任务。近年来,湘、鄂两省认真贯彻落实习近平总书记“共抓大保护、
期刊
“玩”是人类甚至于动物从出生就拥有的一种天性,也是人类发展的必然产物。对于人类而言,游戏是一种很有效的学习方式。因此,通过游戏的方式并融入带有学习性、思考性的社会问题,对于人们来说接受度能得到大幅度的提高。对于本来就对游戏有兴趣的大量青少年以及青年群体,也能通过游戏的方式提升他们对社会问题的思考,提高他们对社会关注的积极性。目前,热带雨林和热带森林文化具有独特又丰富的内涵,它以不可思议的神奇、美丽
学位
随着网络时代的到来,越来越多的小程序、软件层出不穷,但是在系统开发过程中,却极易出现问题,比如软件闪退、手机黑屏、功能失效等问题,这些都需要开发人员在开发中注意、在后续不断查找问题解决问题,也需要测试人员全面测试提交问题点,还需要对用户出现的问题及时反馈,只有这样才能给用户带来愉快的使用体验。Log作为记录软件使用过程中的工作日志,能够方便开发者根据日志内容查找问题原因,帮助开发者解决问题,所以本
学位
构建高效的开发管理体系,已成为众多企业的迫切需求。SR公司作为我国少有的拥有完全自主产权变速器产品的生产企业,研发投入不断增加,但由于开发管理体系缺少系统性,开发整体效率较低、成本较高、周期过长,影响到公司的市场竞争优势。因此,公司迫切需要对开发管理体系进行优化。本文基于集成产品开发(IPD)体系,针对SR公司开发管理中存在的问题,对其进行优化改进。首先,针对SR公司开发管理现状,从开发战略、开发
学位
博物馆作为一种面向大众、服务社会、适应时代的需求并且具备一定社会教育使命的建筑,国内外的学者对其研究一直维持着相对较高的热度。而情感化设计一词是由美国著名的认知心理学家唐纳德·A·诺曼提出的,诺曼教授从认知心理学角度将其分为三个不同的设计层面,分别是本能层、行为层、反思层。本能水平的设计关注的是外形,行为水平的设计关注的是操作,反思水平的设计关注的是形象和印象。根据博物馆展陈空间的特点与情感化设计
学位
近年来,VR/AR,自动驾驶和智能机器人领域的飞速发展,离不开三维场景的识别和理解任务。对于上述领域来说,识别和理解三维场景任务就像视觉系统一样,指导着机器与三维现实世界进行交互,如果视觉系统能很好的识别与理解场景,那么对后续的交互算法将带来极大的帮助。经典的场景识别和理解任务有语义分割,目标检测,实例分割等,这几个任务是对场景的不同层次的理解。语义分割是识别场景中每个点所属的语义类别,目标检测的
学位
云南省临沧市耿马傣族佤族自治县地处中国西南边陲,是我国傣族主要聚居地之一和傣文化的主要传承区之一。由于其跨境而居的地域环境和社会历史变迁等因素,至今保留着与其他傣族地区同中存异的舞蹈文化特征,具有鲜明的地域特色,是灿烂的傣民族历史文化的不可缺少的重要组成部分。笔者以耿马傣族代表性民间舞蹈“古乐舞”“蝴蝶舞”“紧那丽舞”为研究内容,对其生态环境、历史文化、原始信仰、动律形态、动作构成等进行分析,在保
学位