基于自动文摘的辅助文档撰写系统研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:aa121222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大型文档撰写对于企业和用户来说都是极具挑战的问题。随着信息时代的到来,用户在写作中搜索素材的渠道越来越繁杂,信息的浏览、筛选、理解、整理保存也变得愈加困难。自动文摘技术是从一篇或多篇文档中提取其中心思想的技术,它能够帮助人们快速的阅读文档,提取文档中的重要信息和中心思想。在学术界,结合注意力机制的序列到序列架构模型被广泛的应用于生成式自动文摘问题,并取得了不错的成果,也有很多相关工作基于此架构做出了改进。但由于解码器端的误差在测试模型时会被不断放大,这一方法存在着错误累积的问题。本文提出采用双向解码器来对摘要进行解码,反向解码器的解码结果为前向解码器生成摘要提供了参考。通过在编码器和反向解码器端同时引用注意力机制,来生成更完善的摘要内容。同时,本文在反向解码器和前向解码器中都添加了 Pointer机制,解决了词汇表过大的问题。针对中文摘要数据集普遍规模不大的特点,本文提出不分词的技巧来大幅度提升摘要质量。实验结果表明,本文的工作能在中文数据集NLPCC 2017 TTNews和英文数据集CNN/Daily Mail上产生更高质量的摘要。本文同时实现了基于此自动文摘技术的辅助文档撰写系统,融合标签抽取、抽取式自动文摘、网页降噪等技术辅助撰写,帮助用户快速筛选阅读海量信息。系统提供了相关的文档导入、文档和素材管理、结构化标签管理以及文档模板定义功能。同时,支持多个用户共同完成一篇大型文档,阅读与摘要数据能够实时同步。系统采用Django框架和React组件式开发技术完整的集成了上述模型和功能。
其他文献
"3+1"人才培养模式,即通过"3+1"的课程群建设,将一元化的教学模式转化为多元化的教学模式,将课内课外、学期假期、校内校外三大板块有机地结合起来,不断完善产品设计课程群的
重点关注 2009年,我国医疗输液人均8瓶,远高于国际水平,专家表示降低输液率有效干预手段不可少本刊讯(记者李晓雅)“2009年,我国医疗输液104亿瓶,相当于13亿人口每人输了8瓶
目的观察硫酸异帕米星治疗泌尿系感染的疗效和安全性。方法选择2008年05月至2008年12月期间我科在门诊或住院就诊、经尿培养证实的各种泌尿系感染患者107例,其中男67例,女40
陕西西安市东郊20公里处的北务庄村,与“生命水”(即人尿)结缘已逾半个世纪。据传1938年该村青年文明合患眼疾严重,双目红肿、失明。他向终南山云松道人求治,道人不施灵丹妙
期刊
背景与目的VEGF在肿瘤发展中起着重要的作用,是肿瘤治疗的靶点之一。本研究目的是观察VEGF高表达的荷瘤小鼠各脏器的病理改变,并探讨VEGF在肿瘤相关性恶液质发展过程中的作用。
每个幼儿都是独立的个体,他们具有独立性和自主性,因此,在幼儿教育教学活动中,我们要激发幼儿的本能,让幼儿成为活动的主体,鼓励、启发幼儿变“要我学习”为“我要学习”,使幼儿自发
警棍是武警部队和公安干警装备的一种常用装备器具,它对于保障武警部队和公安干警依法有效地执行任务、维护治安起着非常重要的作用。从当前警棍的材料、结构、功能、人机工
(接2016年第3期)4.主动式发动机舱盖根据各个国家的情况,G11/G12装有主动式发动机舱盖如图15所示。与行人发生碰撞时发动机舱盖在铰链处抬起,这样可在发动机舱盖与发动机之间形