基于深度学习的单语及双语句子相似度研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:wfj0808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术日新月异的发展,越来越多的人开始接触大数据和人工智能领域。为了处理随之产生的海量非结构化文本数据,自然语言处理(Natural Language Processing,NLP)的相关研究不断涌现。NLP的典型应用包括信息检索、聊天机器人和机器翻译,其中都涉及到句子的相似度计算,可以认为NLP的很多应用任务就是在判定两个语言单元间的语义相似度,并且随着多语言资源的不断丰富,跨语言的信息交互也愈发频繁。因此,本文主要研究单语上的句子相似度以及跨语言的句子相似度。本文创新性地提出了句子的多语义嵌入矩阵以及句子的双向语义对齐,目的是减少句子语义信息丢失和加强句子之间的语义交互;同时提出潜在单词空间的非线性映射模型来构建跨语言词向量。本文的工作内容和研究成果如下:(1)构建基于多语义嵌入矩阵加权交互的句子对语义匹配模型MSEM-WI(Multi Semantic Embedding Matrix-Weighted Interaction)。MSEM-WI是单语上的句子相似度计算模型,它在Bi LSTM(Bidirectional Long-Short Term Memory)的输出上结合注意力机制和惩罚机制,得到句子的多语义嵌入矩阵;结合语义重要性、语义相似度矩阵和语义加权正交分解进行双向的语义对齐,MSEM-WI脱离了基于单词相似度矩阵的软对齐方法;根据MSEM-WI的副产物,多语义权重矩阵,能够轻易地理解和可视化句子的相似性。MSEM-WI的多语义嵌入和双向语义对齐保证了充分编码句子的语义信息和高度的语义交互,在语义相似度数据集SICK和释义识别数据集MSRP的实验结果证实了MSEM-WI训练时间短,并取得了十分有竞争力的结果;可视化实验展示了MSEM-WI良好的可解释性;各种探索实验表明合适的Bi LSTM层数、惩罚项系数和语义数量能够提高MSEM-WI的实验性能。(2)为了提升编码性能,将MSEM-WI的Bi LSTM层替换为深层双向语言模型BERT(Bidirectional Encoder Representation from Transformer),结合BERT强大的语言表征能力和MSEM-WI建模句子相似度的能力,进一步提升性能。本文在BERT+MSEM-WI上提出了Joint和Separate编码方式,探索BERT编码两个句子和孪生BERT的性能差别。实验表明了BERT能显著提高MSEM-WI的建模能力,在SICK和MSRP上几乎都取得了state-of-the-art的效果,也验证了Joint编码稍强于Separate编码方式。(3)构建基于潜在单词空间的非线性映射模型LWS-NLM(Latent Word SpaceNon-Linear Mapping)和跨语言句子相似度计算模型LWS-NLM+MSEM-WI。LWS-NLM学习跨语言词嵌入,分别利用两个自编码器得到源语言和目标语言的潜在单词空间,并在该空间执行非线性映射,打破了不同语言词向量的同构性假设;为了更好的指导非线性映射,LWS-NLM结合无监督中常用的循环一致性约束、输入重建约束和自学习优化,并利用小型种子词典进行有监督训练。结合LWS-NLM的跨语言词嵌入能力和MSEM-WI的句子相似度建模能力,LWS-NLM+MSEM-WI能直接学习中英文句子的相似性。单词翻译实验和消融实验证实LWS-NLM的跨语言词嵌入性能强于基于线性映射的有监督模型;CE-SICK和CE-MSRP上的中英文句子相似度计算实验和可视化分析表明LWS-NLM+MSEM-WI在双语句子相似度建模上的有效性。
其他文献
湿疹是一种临床常见的具有剧烈瘙痒的变态反应性炎症性皮肤病,各个年龄段均会发生,严重影响患者的心理状态及日常生活,现由湿疹引发的心理疾病越来越多,对患者及其家庭经济造成一定的困扰。目前现代医学治疗方法众多且渐趋完善,主要使用抗组胺药物、抗生素、激素或物理治疗等,但长期使用西药不良反应大、复发率高且会对药物产生依赖性,不适宜长期反复服用。而中医药治疗湿疹历史悠久,价格亲民且疗效显著,可以有效缓解湿疹带
期刊
卷积神经网络(CNN)因其卓越的性能,而被广泛地应用于医学图像分割领域。2-3D混合网络不仅可以获得2D网络所捕获的全局信息,还可以获得3D网络所获得的数据上下文信息,其效果优于单独的2D网络和3D网络。现存的2-3D混合网络通常以级联或单尺度融合的方式来整合2D网络和3D网络,存在对2D网络所提取的特征利用不充分的问题。另外,目前Transformer结构也被广泛地应用于计算机视觉领域,并且已经
学位
随着人工智能与大数据的浪潮来袭,对话系统成为了自然语言处理领域的研究热点,备受业界的关注。早期主要采用基于模板或者检索的方法来构建对话系统,但是此类对话系统存在可移植性差、不够智能等缺点。近年来,深度学习技术快速发展,对话系统有了突破性的发展,能自主回复,但是这样的回复缺少了情感因素,因此实现依附情感因素的自主回复是当下对话系统领域的研究热点。目前,Seq2Seq(Sequence to Sequ
学位
智能优化算法,如遗传算法、蚁群算法、粒子群算法等,是一类受自然现象启发而提出的搜索算法。与传统的优化算法相比,如随机梯度下降算法、牛顿法等,它具有不易陷入局部最优、无需计算问题的梯度信息等优点。在现有文献中,大多智能优化算法一次运行只能解决一个问题,而实际问题往往不会独立存在,解决其他问题的经验知识可以用来指导当前问题的优化,从而实现高效的问题求解。进化多任务(Evolutionary Multi
学位
本文以河池市5所幼儿园大班和3所小学一年级的随迁儿童作为研究对象,调查幼小衔接期随迁儿童社会适应能力的状况,提出幼小衔接视角下提高随迁儿童社会适应能力的策略:重视随迁儿童社会适应能力发展中存在的问题,幼儿园、家庭、学校和政府共同构建随迁儿童社会适应能力培养联动机制等。
期刊
无线电能传输技术(Wireless Power Transmission,WPT),又名非接触传输技术,它能实现在非接触情况下将电能从供电端传送到用电端,免除了电气直接接触,在防水防爆要求高的场合能发挥不俗的作用。当前,WPT技术发展迅猛,特别是磁耦合感应型WPT技术(Magnetic Coupling Inductive Wireless Power Transfer,MC-WPT),近三十年来
学位
膜进化算法是一种抽象于生物细胞结构和活动的进化算法,作为膜计算的应用方向,具有天然的并行框架等特点。在近年来的发展中,被广泛应用于求解各类NP难(Non-deterministic Polynomial Hard)问题并获得了较好的成果。SAT问题(The Satisfiability Problem)是计算机科学的核心问题之一,同时也是首个被证明的NP完全问题,它一直吸引了众多研究人员的关注。3
学位
从文本评论中分析出人们对某方面的情感极性成为当前的研究热点。而根据文本中是否含有方面词,基于方面的情感分析又可分为方面词情感分析(ATSA)和方面类情感分析(ACSA)。本文希望借助句法和深度学习等技术快速地进行情感分析,实现生活场景的智能化。本文主要完成了以下工作:方面词情感分析研究。当前主流方法通常只考虑句子的语序信息,而忽略句子的结构信息。为此本文基于句法和图神经网络提出了多跳句法图卷积网络
学位
消费金融作为我国支撑居民消费和实体经济的基础设施行业,近年来发展迅猛,随着“十四五规划”和“双循环新发展格局”的提出,消费金融的发展优先级又被进一步抬高。消费金融的本质是小额贷款,主要业务是为用户提供消费贷款以满足用户对日常非耐用品的消费。然而随着业务的扩张,消费金融所面临的风险也持续增加。由于存在信息不对称,金融机构在为用户提供消费贷款时难以全面掌握用户的信息,不良贷款率节节攀升,给国家和金融机
学位
近年来,物联网(Internet of Things,Io T)技术的快速发展和在线社交媒体的兴起促进了地理位置社交网络(Location Based Socail Networks,LBSNs)的繁荣。基于位置的影响力最大化问题受到广泛关注,该问题旨在从LBSN中寻找最具影响力的种子用户,从而推动目标地点吸引更多的访问者。该问题在许多重要的Io T场景中得到了应用,如病毒式营销、广告部署等。然而
学位