基于背景知识感知的对话生成算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:dragon1788
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受互联网技术的覆盖以及移动端设备激增的影响,人工智能逐渐渗透到人们商业生活的方方面面。对话系统作为人工智能领域下的重要产物,得益于数据的支持以及深度学习技术的进步,也逐渐向更人性化方面发展。对话系统从特定领域下的任务型逐渐发展到开放领域下的聊天型,从固定规则下的检索型发展为Seq2Seq框架下对话生成型。综合国内外研究现状,基于生成的对话系统能够脱离规则的束缚生成数据库中没有但合理的回答,且模型的迁移性好,灵活性高。但当前对话生成模型仍存在过度依赖特定数据集、回复单一、信息含量低、逻辑混乱等问题。针对当前问题症结所在及对话系统需求,本文从对话上下文以及知识图谱出发探究聊天型对话系统的回复生成,主要工作如下:(1)显式加权上下文。为充分利用对话数据中的历史信息进行对话生成,本文在上下文利用中引入点互信息算法,通过寻找对话上下文与当前对话之间的依赖性作为对话上下文的相关值,并进一步借助拼接与求和两种方式实现上下文融合,最终实现基于显式加权上下文编码的对话回复生成。该方法的关键在于通过句子间相关性计算,从而使模型关注与当前对话高度相关的上下文信息。(2)背景知识感知。为解决对话生成中知识含量低、回答单一的问题,本文引入外部知识图谱,一方面弥补对话系统在与人对话中背景知识匮乏的缺陷,另一方面实现上下文信息的充分利用。在具体实现上,首先根据当前对话初步检索相关知识,但检索知识中存在与当前对话无关的信息,这不可避免地影响回复生成的质量。因此本文基于与当前对话高度相关的上下文编码在已检索知识上进行选择,进一步将相关上下文以句子形式扩充到已选择知识结构中进行回复生成。本文首先通过点互信息算法完成对话上下文的显式加权,实现了对话生成中对话上下文语境的有效利用,并且通过具体的实验分析来看,本文所构造的显式加权上下文的编码模型能够捕捉到更丰富的对话信息,从而生成更多样化且流畅的回复。进一步,为弥补对话生成中背景知识不足的问题,本文从当前聊天式对话系统的需求出发,研究开放领域下对话上下文以及知识图谱结合下的对话生成算法,最终本文模型在中英文数据集上的评估均表现突出,优于最先进的方法CCM,并且通过案例分析来看,本文所构建的基于背景知识感知的对话生成模型为对话生成增加了知识性信息,从根本上解决了对话生成回复的单一性问题。总体来说,本文围绕对话上下文以及背景知识感知的研究推动了对话生成系统的人性化发展,也为后续人工智能产品的研究提供研究价值。
其他文献
随着影视行业的发展与渲染技术的进步,高质量的作品也大量涌现。画面是检验一部好作品的重要依据,而这些画质背后是各种渲染技术的支撑。渲染就是通过计算机对现实世界进行模拟,再用算法把场景中的模型、材质和灯光绘制成图片或者视频。在绘制一些比较复杂的场景时,由于光线在场景中传播的递归性,一些渲染算法在绘制的过程中会有较大的时间代价或者偏差。存在于现实世界中的云、烟雾、蒸汽等半透明状的物质在图形绘制领域一般被
学位
在许多实际应用的领域中,许多过程都可以用正系统来建模。正系统意味着只要初始状态和输入是正的,则输出和状态变量总是非负的。当正系统具有一定的切换规则并且系统的动力学在不同的时间间隔内被不同的正子系统控制时,该系统被称为切换正系统。切换正系统在网络拥塞控制、信息科学、医学和神经网络等领域都发挥着极其重要的作用,因此,研究切换正系统是非常有益的。但是同样也会遇到挑战,当切换后的正系统遇到脉冲时,系统的状
学位
当前我国汽车保有量大,停车难成为急需破解的民生问题。随着大数据的产生与不断发展,建立智慧停车系统成为解决传统停车问题的有效手段。而县城是我国城镇体系的重要组成部分,县城停车问题又具有一定的独特性,文章立足于县城停车现状,针对县城停车特有问题,以温州市苍南县城新区为例,研究县城智慧停车系统建设方案,因地制宜选取技术手段并配套完善的管理制度与保障体系,缓解县城交通拥堵,提升停车位资源利用率,推进县城数
期刊
癌症亚型的识别对个性化医疗的应用具有重要意义。它致力于使用无监督聚类方法将癌症患者划分为不同的亚型,并为后续的治疗方案提供有价值的参考。近年来,随着测序技术的快速发展,其产生的丰富的多组学数据为在整体水平上发现癌症亚型带来了前所未有的机遇。然而,由于测序技术的限制,组学数据中往往包含大量的噪声。此外,尽管测序成本在不断下降,但仍然难以覆盖大量的样本,这使得目前的组学数据大都呈现出高维小样本特点,并
学位
跨模态由文本生成图像是大数据人工智能领域的重要研究课题,其发展推动了跨视觉和语言的多模态学习和推理的研究进程,是近年来最活跃的研究领域之一,在诸多行业有着广泛应用,如艺术生成、游戏引擎和计算机辅助设计等。根据自然语言描述生成与之语义匹配的图像是一个复杂的计算机视觉和机器学习问题,近年来取得了很大的进展。然而,目前大多数由生成对抗网络辅以语义约束的图像生成网络仅提高了图像的视觉真实性和语义一致性,而
学位
目前的医疗影像任务中,磁共振(Magnetic Resonance,MR)图像的获取存在价格昂贵和耗时长的问题,需要借助技术手段获取多对比度MR图像,如今通过深度学习算法研究磁共振图像的合成以提高诊断效率成为一个炙手可热的话题。随着生成对抗网络(GAN)在近年来的图像处理领域中发挥了重要作用,本文主要将结合生成对抗的方法研究不同对比度磁共振图像的合成。现有的一对一MR图像合成方法中,多数只关注图像
学位
科技与信息化发展致使数据存储量呈“爆炸式”发展,为了解决信息过载问题,推荐系统应运而生。如今,推荐系统被广泛应用到各类电子商务领域及线上购物领域,在提高网站商品转化率、用户选择效率及市场公平性等方面具有重要作用。但是由于推荐系统的脆弱性,部分不法分子在利益驱使下对推荐系统进行有目的的攻击,以使得推荐系统的推荐结果产生偏移。因此,为保障推荐系统的推荐质量与用户对推荐系统的信任度,针对攻击环境下的推荐
学位
抑郁症对人类的身心健康造成极大伤害,甚至危害社会。因此,尽早发现抑郁症早期症状并及时治疗极为重要。抑郁症的早期状态称为抑郁倾向。与大多数正常人一样,抑郁倾向患者会在社交媒体平台上分享自己的故事,表达情绪,以及寻求帮助和支持。因此,海量的社交平台数据为我们挖掘抑郁倾向的特征和发现抑郁倾向患者提供了可能。但是,如何更好地利用社交媒体平台数据,挖掘能够识别用户抑郁倾向的重要特征成为一项难题。尽管目前已有
学位
沪港通和深港通是我国证券市场开放的里程碑事件,研究借道沪深股通投资A股的北上资金,对我国资本市场开放进程尤为有意义。本文理论研究与实证研究相结合,将统计检验、事件研究法、线性回归、多因子模型运用于研究北上资金入市特征,及其持仓股票定价的有效性。通过对2014年11月17日以来沪深股通进行指数分析发现,在样本时期内,北上投资者具备择时能力,他们在指数相对较低的区间买入,在指数相对较高的区间卖出,证金
学位
自从人们进入信息化时代以来,互联网一直在潜移默化地影响着人们的日常生活。电子产品在日常生活中随处可见,微博、淘宝等网络平台为人们获取外界信息提供了便利,同时也产生了大量对时事以及产品的评论文本。文本情感分析是挖掘评论文本表达的情感信息,挖掘其中蕴含的情感信息可以为消费者提供决策支持,有助于商家及时获取反馈信息并对产品进行完善升级,同时有助于政府正确引导舆情风向。因此文本情感分析具有巨大的实用价值。
学位