双语新闻差异性摘要方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:andytong0123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语新闻差异性摘要分析是自然语言处理领域中的重要研究方向之一。随着一带一路的发展,我国与其他国家的交流变得日益密切,我们需要更加精确地了解其他国家在某一话题下与我国的不同看法。国内外各新闻媒体都会发布大量的新闻报道,可以帮助我们很好的了解不同国家对待某一话题差异性。本文的研究目标就是通过双语新闻报道,根据设计的差异性摘要抽取方法,获得两种语言在同一个话题下新闻报道的差异性。针对以往多文档摘要的研究没有充分利用主题信息以及语义信息,差异性摘要的研究目前仅仅停留在依靠机器翻译进行双语处理阶的问题,本文在现有方法的基础上,对双语新闻差异性摘要方法进行分析和研究,主要内容如下:1.融合多信息句子图模型的多文档摘要抽取针对现有多文档抽取方法不能很好地利用句子主题信息和语义信息的问题,提出一种融合多信息句子图模型的多文档摘要抽取方法。首先,以句子为节点,构建句子图模型;然后,将基于句子的贝叶斯主题模型和词向量模型得到的句子主题概率分布和句子语义相似度相融合,得到句子最终的相关性,结合主题信息和语义信息作为句子图模型的边权重;最后,借助句子图最小支配集的摘要方法来描述多文档的摘要。该方法通过融合多信息的句子图模型,将句子间的主题信息、语义信息和关系信息相结合,与传统方法相比,该方法能够有效的改进抽取摘要的综合性能。2.基于图卷积的双语多文档差异性摘要抽取为了高效的抽取差异性摘要,则在已经抽取摘要的基础上,进一步抽取差异性摘要,针对现有方法利用机器翻译对双语文本进行翻译基础上对双语新闻差异性摘要抽取中存在语义转换偏差的问题,以及更好地根据双语新闻句的表示能力和语句关系信息,提出一种基于图卷积的双语多文档差异性摘要的方法。首先,根据已抽取的摘要信息构建差异性摘要图结构。其次,利用图卷积神经网络,获得差异性摘要图聚合后的句子节点表征。然后,利用GRU模型,获得双语摘要文档的向量表示。再通过计算双语摘要文档向量与句子节点表征获得摘要句的显著性得分。最后,按照显著性得分,分别抽取出中英文的差异性摘要。此方法,避免了使用双语翻译在差异性摘要抽取中的偏差问题,提高了抽取双语多文档差异性摘要的质量,实验结果表明了该方法的有效性,证明了在处理双语新闻差异性摘要方向上将图中的句子关系与神经网络的表示能力相结合的优点。
其他文献
自然界中很多生物,如海萤、萤火虫、水母、细菌、腰鞭毛虫、荧光鱿等,都拥有发光的能力。在这些发光生物中,由于海萤和萤火虫的发光效率较高,备受生物学家和化学家青睐。由于海萤和萤火虫结构简单、量子产率高、对环境敏感、光稳定性好、对质子有好的选择性和可逆性等优点,常用作荧光探针材料用于细胞p H的检测。但天然氧化荧光素的发射波长较短,荧光的组织穿透性较差,易被细胞组织吸收,要扩大海萤、萤火虫的应用范围,必
稀土离子掺杂上转换纳米发光材料有着荧光波段丰富、光化学稳定性高、荧光寿命长等优势,近些年在生物医学、三维显示、上转换激光等领域应用广泛。但纳米颗粒中较多的缺陷导致非辐射弛豫几率增大,降低了稀土离子上转换发光效率,限制了其应用。针对上述问题,研究者提出了很多上转换增强策略,然而针对传统三维绝缘型上转换基质,其不利于稀土离子电子跃迁及其发光行为的调控。与之相比,层状半导体具有与二维材料相似而丰富的各向
固着生长的植物在长期进化过程中形成了多种抵御不利环境的应答机制,活性氧(Reactive Oxygen Species,ROS)作为第二信使在植物响应生物和非生物胁迫中起重要作用。由保卫细胞构成的气孔是气体和水分交换的主要通道,也是病原菌入侵植物叶片的重要途径。植物应答病原菌入侵时通过刺激保卫细胞中的ROS产生以促进气孔关闭,这种主动限制病原菌入侵的机制被称为气孔免疫。褪黑素和黄酮醇是植物重要的小
学位
学位
铝毒是酸性土壤中限制植物生长的主要因素之一。传统改良酸性土壤的方法是使用石灰和络合剂,但效果不理想。因此,我们研究植物抗铝的生理生化机制,利用基因工程技术培育转基因耐铝植物品种来提高植物抗酸性土壤中的铝毒能力和持续生产力。本研究以铝抗性丹波黑大豆为实验材料,克隆其超氧化物歧化酶基因(GmSOD)和过氧化氢酶基因(Gm CAT)。构建GmSOD基因原核表达载体,诱导纯化蛋白,并分析其酶学特性。构建植
本文通过搭建D30TCI柴油机加装DOC和DPF的试验台架,开展了DPF的初步试验,为模型的构建及其可靠性验证提供了基础试验数据,对DPF进行了国6瞬态循环的测试试验,并对DPF进行了破坏性主动再生试验。采用一维热力学软件分别构建了柴油机后处理系统模型和带后处理系统的柴油机整机模型,在考虑灰分沉积的情况下对国6 DPF的基础性能参数进行了优化选型,同时研究了灰分和DPF对柴油机性能的影响,并对DP
近年来柔性显示技术迅速发展,柔性显示屏是一种有机的用户界面,相比于传统的刚性显示界面它能提供更好的用户体验,比如柔性设备能带来真实的“纸张体验”,直观的物理界面容易理解使其具有很高的可用性,而目前还没有完善的柔性屏交互技术,使得研究出一套有效合理的柔性交互技术尤为重要。尽管在柔性屏交互技术的相关研究中,已经有研究者对弯曲输入的手势进行了设计,但是他们没有对弯曲和扭曲的输入手势进行相关研究,用等级划
近年来,随着国家工业化水平的日益提高,对综合性能优异的钢材需求越来越广。Ti微合金钢由于具有的优良性能,并且钛矿在我国产量丰富价格低廉,一直是微合金钢领域较为热门的微合金钢种。但Ti微合金钢中Ti元素较为活泼,易与杂质元素形成夹杂物,同时Ti C的析出具有较高的温度敏感性,可能导致钢板性能出现波动。本文针对Ti微合金化钢在轧制过程中奥氏体组织晶粒粗大和夹杂物多等问题,添加Zr和Mo元素,研究Zr和
软测量技术是实现难测参数在线实时估计的一种有效手段,在冶金、造纸、制药、石油、化工等生产过程的监测、控制及优化中扮演着日益重要的角色。由于实际工业过程往往呈现出非线性、时变性、多模式、多时段等过程特性,使用传统的全局建模方法难以得到令人满意的结果。因此,即时学习作为一种典型的局部学习建模方法在软测量建模领域日益受到青睐。本文从即时学习软测量建模技术出发,研究高性能的集成即时学习软测量建模方法。论文