基于深度学习的跨语种文本摘要系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:soj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算能力的迅速提升和人工智能技术的飞速发展,自然语言处理(NLP)作为其重要的研究领域,具有很高的研究价值和广阔的应用场景,并已经成为了备受瞩目的研究课题。本文旨在利用深度神经网络技术,通过对长文本外语到目标语言的翻译,然后对长文本关键内容的智能化摘取,从而实现提取外语的关键部分,达到快速阅读不同语言文章核心内容,获取关键信息的目的。本文的研究目的是基于深度学习的跨语种文本摘要系统的设计和实现,通过将机器翻译和文本摘要进行了技术创新结合,并对深度神经网络架构进行修改,针对翻译精度和摘要精度提升,所做的主要工作如下:(1)参照BERT模型,引入预训练模型,在进入机器翻译模块和文本摘要模块之前,提前对语料进行训练,使得提升输出结果的精度;(2)在机器翻译模块中利用Transformer模型,并将其中的Self-Attention修改为Adaptive-Attention,使得模型能够自动修改关注范围;(3)在文本摘要模块中参照HSSAS模型做关键信息提取,将其中Bi-LSTM框架修改为网络结构更加简单,效果也不相上下的Bi-GRU。利用机器翻译技术对目标文本进行精准的翻译,然后利用文本摘要技术对文本的核心内容进行提取,缩短文本内容。输入的是源语种长语料,输出的是目标语种的短语料。最后,通过设计模型优化前后的对比实验,测试了预训练模型的优化效果;对比并分析了机器翻译模型中不同Attention架构,探索No-Attention、Attention、Self-Attention、Adaptive-Attention对于实验结果的区别;比较了文本摘要模型中Bi-LSTM结构和Bi-GRU结构,研究替换后的模型的优化效果。本系统通过预训练模块对大量的中英平行语料进行训练,使得模型的准确率能够得到保障,能够准确地进行英文到中文的翻译,然后再采用抽取式文本摘要技术获取翻译内容的重点信息,达到能够比较精准地提取出文章的核心内容。从而实现了系统的初衷-跨语种文本摘要。
其他文献
随着移动无线通信的快速发展,人们对通信服务流量与质量的需求量日益增长,未来5G网络的流量业务需求也将日益增加。毫米波大规模MIMO异构网络可以通过密集化部署来满足用户日益增长的流量需求,但同时也会带来更严重的干扰问题。如何最大程度的消除干扰,并实现频谱效率在用户间的公平分配是现在研究的重点问题。而毫米波大规模MIMO异构网络的多天线结构使得在发射端能够对波束进行赋形,优化波束方向和功率,从而减轻甚
双天线GPS导航系统能够提供陆上车辆导航所需的速度、位置和航向角信息,但由于GPS信号输出频率低,并且易受干扰,尤其是在车辆转弯时,很难保证车辆航向角信息的精度,而光纤陀螺捷联惯导系统具有体积小、灵敏度高、输出频率高等众多优点,能够在较短的时间内保持一定的姿态角精度,但对于陆上车载导航光纤陀螺成本较高,因此本文提出一种基于单轴光纤陀螺的低成本的简化惯导系统(简称RISS)设计方案,利用设计的简化惯
随着网络传输与数据计算等需求的不断增长,IT(Information Technology,信息技术)机房设备资产的规模与数量也愈发膨胀。在传统的机房管理模式下,管理人员需要对大量的设备进行人工盘点,并进行纸面的信息录入。人工进行信息收集录入与管理带来了大量的人力消耗,并无法保证设备信息录入的准确性与快速性。随着通信与互联网行业的快速发展,对IT机房设备资产管理方式的信息化与智能化变得愈发得迫切。
目的:中暑是一种严重的热性疾病,主要表现为体温过高与中枢神经系统功能障碍,严重的中暑可导致多脏器功能衰竭,具有较高的死亡率与致残率。当前研究认为,下丘脑主动参与体温调节功能障碍,在重症中暑发生过程中具有关键作用,但目前具体病理生理机制尚未明确。本研究中通过建立重症中暑小鼠模型,利用组织病理学、二维荧光差异凝胶电泳分析、基质辅助激光解吸电离飞行时间质谱明确下丘脑的损伤并分析鉴定下丘脑差异表达的蛋白质
段落式图像描述任务旨在为给定图像生成描述性的自然语言段落,连接着计算机视觉和自然语言处理两个关键领域,是跨媒体智能的重要研究方向,其研究进展对于打破图像和文本间的语义鸿沟至关重要。近年来,随着深度学习的发展,得益于循环神经网络(Recurrent Neural Network,RNN)家族出色的时间序列建模能力,基于层次性RNN的解码器已被广泛采用于段落式图像描述任务上。然而,RNN结构上的限制使
从广义上讲,参与可以定义为个人或实体决定与其他实体或个体合作或结盟。将这一概念置于本研究课题的背景之下,可以理解为津巴布韦的议程是与国际社会中的行为体重新结盟或合作。在此外交政策出台之前,诸多因素导致津巴布韦被排除在国际社会中的双边和多边关系之外。因为津巴布韦被认为缺乏透明度和选举期间的政治暴力而违反民主。2000年代初,津巴布韦政府开始实施“快速土地改革方案”,下令没收所有白人商业农场,并将其交
伴随着经济的快速增长和城市集群化迅猛发展,长江三角洲地区(简称“长三角”)人为大气污染物排放量显著增加,成为区域性复合型大气污染非常突出的区域。由于城市紧邻,地势平
自我教育是大学生思想政治教育的重要组成部分,随着对大学生思想政治教育研究的深入,对自我教育的研究已经成为大学生思想政治教育工作面临的重要课题之一。自我教育就是在思想政治教育过程中,教育对象根据社会发展和自身发展的要求,产生自我学习的意识,再通过深刻自我意识、明确自我选择、优化自我调控和科学自我评价等方式,在学习过程中克服错误思想和行为,使自己的政治倾向和思想品德不断完善和发展,不断发挥教育的主体地
氮、磷是造成水体富营养化的主要物质,城镇生活污水因排放量巨大而成为一个重要污染源,近年来对氮、磷排放要求日益严格。反硝化除磷工艺因解决了传统脱氮除磷工艺所存在的固
生态安全是未来经济社会稳定发展的主要保障,已具有与政治安全、经济安全等同等重要地位。“一带一路”倡议构想下,东北边境城市作为东北亚开放的重要窗口,其生态安全是维护国家主权安全、促进国家合作和区域经济发展的关键。东北边境城市生态安全状况受多方面因素综合影响,需要全面分析,明确安全和不安全区域,为生态安全维护与管理战略提供导向,保障陆疆生态环境和经济社会有序发展。本文全面分析威胁边境城市生态安全的自然
学位