基于注意力机制的生成式对话模型

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:tongjm2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十一世纪,在人类进入信息时代,尤其是互联网时代之后,产生了大数据。同时半导体行业在“摩尔定律”的推动下,生产出了拥有更高计算能力的芯片。在大数据与高性能计算设备的加持之下,神经网络的能力得到了充分的体现,人工智能的研究也进入了新的浪潮。从2012年的Alex Net到2020年的Alpha-fold,神经网络加持下的人工智能在许多领域都取得了重大的突破。对话系统作为人工智能的重要研究领域之一,也在这个浪潮之中得到了新的发展。对话系统可以分为任务式对话与非任务式对话两类。任务式对话系统一般以管道方法为基础,以检索式生成作为回复的生成方式。但是对于非任务式对话,也就是闲聊,要求对话活泼自然,而检索式方法生成的回复比较僵化,所以难以胜任闲聊任务。人们于是将在机器翻译任务上取得了很好效果的序列到序列模型迁移到了对话任务上。这种方法的确使得回复的生成更自然了,但是也存在着生成不合理回复的问题。为改善序列到序列模型的回复生成质量,本文在相关研究的基础上,建立了一个基于注意力机制的序列到序列模型。在模型编码过程中,我们使用双层双向循环神经单元对输入句子进行了双向处理,以得到句子更好的表示;在模型解码生成回复的过程中,我们使用了单层循环神经单元,并引入了线性注意力机制和Beam Search算法。最后,我们在Star War Scripts数据集上进行实验以测试本文模型的性能。实验结果表明本文模型生成的回复更合理流畅,因为本文模型在困惑度指标与BLEU值上的得分都优于对比模型。同时也表明,本文模型在编码过程中使用循环神经单元对句子进行双向处理,使得模型的编码器捕获了句子更丰富的结构信息,有助于提高回复生成的质量;在解码过程中使用注意力机制使解码器根据当前解码状态调整解码操作,解码出更合理的句子。
其他文献
背景和目的肝细胞癌在全球范围内严重威胁了人类的健康,因此致力于肝癌发生发展的分子机制研究,以开发新的靶向药物是一项十分重要的课题。N6甲基腺苷修饰(N6-methyladenosine,m6A)作为机体内最丰富的RNA修饰,不仅广泛调节各种生理过程,也参与多种疾病的发生,特别是肿瘤。有研究发现,m6A调节蛋白中的“reader”阅读蛋白YTHDF1(YTH N6-methyladenosine R
肝细胞肝癌(Hepatocellular carcinoma,HCC)是病死率最高的恶性肿瘤之一,经过数十年的发展,逐渐形成了以外科手术为主的综合治疗体系。然而近20年来肝癌的5年生存率并没有进一步的提高,究其原因是与肝癌切除后高复发率和转移率有关,因此探索肝细胞肝癌转移和复发的分子机制是目前肝癌基础研究的重要内容。RNA结合蛋白(RNA binding proteins,RBPs)能够与靶RNA
目的交感神经激活与慢性肾脏病(CKD)进展有关,慢性衰老细胞在老化和损伤的肾脏中积累,导致肾损伤后进行性纤维化。本研究主要探讨肾脏交感神经调控细胞衰老在肾脏纤维化中的作用及机制,为探索防治慢性肾脏病的新治疗靶点提供理论依据。方法首先我们建立了肾脏去神经动物模型,并在去神经成功2天后构建单侧输尿管梗阻(UUO)和单侧肾脏缺血再灌注损伤(UIRI)小鼠模型,以探讨肾交感神经与CKD以及与肾脏衰老的关系
随着光子学和激光技术的飞速发展,光场调控成为拓展激光应用的重要手段,也是当前光学领域的研究热点。矢量光场具有随空间位置变化的幅度、相位和偏振态分布,拥有独特的紧密聚焦场特性,在光学微加工、光学微操纵、等离激元定向传播、量子光学等领域得到广泛应用。本文从Richards-Wolf矢量衍射理论出发,结合偶极子天线辐射理论,研究了矢量光场的紧聚焦场特性及光学偏振拓扑结构。(1)基于Debye积分讨论了用
目的:探讨在HepG2细胞胰岛素抵抗模型及糖尿病肥胖小鼠模型中,TRIB2对胰岛素抵抗的影响。方法:1、棕榈酸诱导HepG2细胞24小时,建立胰岛素抵抗细胞模型,检测胰岛素信号通路证实模型建立成功后观察TRIB2的转录及蛋白质水平变化;2、在胰岛素抵抗细胞模型中,利用质粒或siRNA分别过表达或降低细胞内TRIB2蛋白水平,检测细胞对培养基中葡萄糖消耗量,Western blots方法检测胰岛素信
全球化高速发展的今天,场景文字语种识别作为场景文字识别任务的前提,越来越多地受到关注。遮挡、纹理背景和模糊;文字的不规则分布;文字本身变化多端,同一语种文字外观存在差异,难以归为同类;不同语种的文字又存在相似,甚至会共享字符,比如中文和日文,都会严重影响对场景文字语种的判断。本文尝试从全局和局部双视角研究场景文本语种识别。全局视角针对不包含区分性字符的样本,而局部视角针对包含区分性字符的样本。论文
目的唾液腺蛋白1(SP1)作为一种近年新发现的干燥综合征的标志物,在疾病进程中的作用机制仍然未知。本实验旨在通过利用SP1蛋白免疫诱导建立干燥综合征动物模型,同时检测确诊SS病人的血清中抗SP1抗体含量,来探究SP1在干燥综合征中的作用。方法1、8周龄雌性C57BL/6小鼠和8周龄雌性IL14α转基因小鼠(自发干燥小鼠)各被随机分为两组:SP1实验组和PBS对照组,两个实验组小鼠在第1天、第14天
随着我国与其他国家的人员交流加深,护照的智能化认证在金融物流、自助通关等领域推行。护照认证系统通过护照鉴伪算法对护照多光谱图像进行检测并判断真伪,检测的重点是防伪特征。因为紫外光谱图像的防伪特征丰富且难以仿造,所以紫外防伪特征对于整个护照认证系统具有十分重要的作用。由于护照认证过程中紫外光谱图像质量不稳定、护照背景干扰性强的问题,紫外防伪特征的鉴伪效果不理想。本文结合紫外防伪信息增强和紫外防伪特征
研究目的1、系统评价ICU获得性衰弱风险预测模型,分析现有关于ICU获得性衰弱预测模型的优缺点;2、通过Meta分析明确ICU获得性衰弱的危险因素;3、构建ICU获得性衰弱风险预测模型,为临床工作者早期发现ICU获得性衰弱高危人群提供有用的工具,进一步完善ICU获得性衰弱的规范管理,降低ICU获得性衰弱的临床发生率。研究方法1、文献分析法:广泛检索与阅读国内外文献,了解ICU获得性衰弱风险预测模型
视频作为一种数据量巨大的信息载体,其压缩和传输问题一直是一项研究热点。近年来,随着视频应用的不断丰富和发展,人们对高清视频的需求也在不断提升。已经得到广泛应用的第三代视频编码标准(如HEVC、AVS2)已经不能满足未来市场需求,在此背景下,国际标准化组织提出了新一代视频编码标准——多功能视频编码(Versatile Video Coding,VVC)。VVC在各个模块均引入了很多压缩性能优异的新技