基于神经网络的释义判别研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:nvhuang123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于神经网络的释义判别研究指使用神经网络模型判定两段文本在语义上表述是否具有一致性。释义判别是机器翻译、对话系统、自动问答和抄袭检测等研究的基础,是自然语言处理的关键技术和核心问题。本文以提升释义判别的性能为目标,从释义判别中不同句法结构在交互过程中作用的不同、句子内的多粒度对象交互不足以及具有局部匹配敏感性的文本释义判别三个方面,在注意力机制、自注意力机制、卷积神经网络等深度学习框架下开展释义判别研究。本文主要研究工作包括:(1)针对现有句子级释义判别方法没有考虑不同句法结构在交互过程中应具有不同作用的问题,本文给出基于注意力机制的句法语义交互释义判别模型MSSIAM(A Model of Syntactic and Semantic Interaction based on Attention Mechanism),模型将句子的粒度划分到词汇充当的句法角色上,通过句法和语义相融合的方式得到包含语义信息的句法结构,完成词汇与句法结构的交互。然后使用神经网络中的注意力机制完成句法与句法间的交互,解决释义判别中不同句法结构在交互过程中具有不同作用的问题。模型在MSRP数据集进行验证,基于注意力机制的句法语义交互释义判别模型和不考虑句法权重模型进行了比较,实验结果验证了MSSIAM的有效性。(2)针对现有句子级释义判别方法对单词、短语和句子等多粒度为代表的语义交互不足的问题。本文给出基于自注意力机制的多粒度交互释义判别模型MGIPIM-SAM(Multiple Granularity Interactive Paraphrase Identification Model based on Self-Attention Mechanism),模型使用展开式自动编码器得到单词、短语和句子等多粒度特征的语义表达。通过引入神经网络中的自注意力机制,解决释义判别中单词、短语和句子等多粒度特征间语义交互不足的问题。模型在MSRP数据集上进行验证,实验结果显示MGIPIMSAM获得了更优的F-score值。(3)针对现有篇章级释义判别方法没有对局部释义进行建模匹配的问题,本文给出基于连续卷积的局部语义匹配模型PMCNN(Partial Matching Convolution Neural Network),模型以连续卷积、连续池化为手段提取局部释义特征,使用多层感知机完成特征间的交互,解决释义判别中局部释义的建模匹配问题。模型在PAN@2013和PAN@2014抄袭源检索数据集上进行验证,实验结果表明局部语义匹配模型具有统计有效性的优于基线方法。
其他文献
国家公园是一种行之有效的实现生态环境保护与资源开发利用双赢的自然保护地管理模式。我国自2013年正式提出建立国家公园体制,经过6年多的实践探索,国家公园体制试点建设已成为近年来生态文明体制改革成效最突出的组成部分,在当前试点工作全面推进的关键时期,探讨适应我国国情的国家公园的规划与管理模式是亟待解决的热点问题。对国家公园进行功能区划是实现公园保护、科研、教育、游憩和社区发展等多功能的管理基础,是协
低合金钢因其较好的综合力学性能以及低廉的价格而广泛用作火力发电设施、石油化工厂的热端结构材料。但在常见的20 mass%)的Fe-Cr合金可以充当理想的防护涂层,原因在于它一则在上述条件下可以热生长Cr2O3氧化膜,二则它
近年来,建筑行业竞争日益加剧,粗放的成本管理模式难以保证项目利润,精细化成本管理日益受到重视。目前工程项目采用工程量清单计价,而会计核算仍然按照与概预算制度费用相适应的核算方法,使得成本核算在成本控制和成本分析等重要环节的作用发挥受限。那么一个与工程造价相适应的成本核算方法就显得尤为重要。加之大多数施工企业的工程项目都是在异地进行,财务管理难度大,信息传递滞后,极大的降低了成本管理效率。本文首先通
随着我国基建水平的不断提升,越来越多的巷道工程项目得以实施,而岩爆等动力灾害又严重威胁着施工安全,因此研制锚杆支护设备保障巷道工程施工安全是十分有必要的。本研究课题来源于国家自然科学基金重大科研仪器研制项目:深部巷道/隧道动力灾害物理模拟试验系统,编号:51427803。此系统模拟现实岩爆等自然动力灾害,对巷道工程从加载、开挖、支护到检测的整个过程进行模拟试验,对更进一步揭示巷道/隧道岩爆等动力灾
在国民经济持续发展的过程中,国家倡导对废弃物进行资源循环利用,其中利用废弃物开发环保建材成为当下热点的研究课题。如何采取有效的方式对造纸企业产生的造纸黑泥进行无害化处理并进行资源再利用,在减少废弃物排放的同时变废为宝、产生新的效益,是当前的研究热点。利用广西科学技术厅《利用建筑废弃烧结页岩砖生产再生烧结页岩砖的研发》项目经费的支持,本文对如何把造纸黑泥添加到页岩矿粉中生产出造纸黑泥烧结页岩砖及其性
随着计算机技术和电子技术的发展,图像采集设备的性能得到的极大的提高,本文基于高清网络摄像机搭建了双目立体视觉系统,研究了双目视觉成像模型和影响测量精度的因素,以及部分影响图像采集质量的要素,以实现了双目视觉系统的图像采集、校正、图像加强、特征检测及匹配,最终实现目标的测量为目的。本文研究内容主要分为四个部分,对摄像机模型建立和校正、双目模型的校正、双目立体视觉的目标特征检测与匹配方法及双目视觉测距
自问世以来,石墨烯和离子液体在润滑领域展现出广泛的应用前景。研究表明,使用离子液体对石墨烯进行剥离和功能化,可以大幅提升石墨烯的结构完整性和分散稳定性,从而从界面吸附层面上影响石墨烯的润滑性能。研究石墨烯和离子液体的协同减摩性能和机理对于学术和工业应用都具有重要意义,并为开发新一代绿色润滑添加剂提供了新的思路。本文利用液相超声辅助的方法制备了石墨烯/离子液体复合材料(G/IL复合材料)。使用摩擦试
目的:1.理清古今所用败酱草的基原、入药部位和产地的沿革与变迁;2.掌握安徽省败酱属植物的种类、分布以及蕴藏量;3.寻找败酱草专属性鉴别方法,以准确、快速鉴别败酱草;4.确定败酱草的基原、入药部位、产地和采收时期,保证败酱草的质量;5.为安徽济人药业中成药大品种--疏风解毒胶囊原料药之一的败酱草药材及饮片制定行业质量标准。方法:1.查阅并系统整理历代本草书籍有关败酱的记载;2.采用野外实地调查、样
学位
丝素纤维是一种天然高分子材料,不仅具有优异的机械性能,生物降解性、生物相容性,而且具有独特的物理和化学性能,在生物医学、柔性导电等领域有着广泛的应用。不足的是,与其他合成纤维相比,丝素纤维有几个缺点,例如起皱、变形和微生物引起的降解以及光诱导的衰老和泛黄。因此,丝素纤维通常被各种方法改性,以适应不同的环境需求。其中,利用辐照诱导自由基改性是诸多改性方法中极具意义的一种方法,具有改性均匀、适配绿色环