【摘 要】
:
伴随着大数据时代的到来,互联网上的文本信息每天以指数级增长,人们难以高效地获取海量文本中的重要信息,因此自动生成文本摘要成为当下的迫切需求。随着深度学习技术的发展及大规模数据集的出现,自动摘要技术取得显著进展,从抽取式方法逐渐过渡到生成式方法。抽取式摘要主要通过抽取文本中的重要句子形成摘要。生成式摘要则基于对文本的语义理解以生成尽可能简洁流畅且符合事实的,其生成方式往往更为灵活,通常可包含不在文本
论文部分内容阅读
伴随着大数据时代的到来,互联网上的文本信息每天以指数级增长,人们难以高效地获取海量文本中的重要信息,因此自动生成文本摘要成为当下的迫切需求。随着深度学习技术的发展及大规模数据集的出现,自动摘要技术取得显著进展,从抽取式方法逐渐过渡到生成式方法。抽取式摘要主要通过抽取文本中的重要句子形成摘要。生成式摘要则基于对文本的语义理解以生成尽可能简洁流畅且符合事实的,其生成方式往往更为灵活,通常可包含不在文本中的词语或片段,但生成式易出现生成不准确、关键信息缺失等影响摘要质量的突出问题。基于此,本文提出在摘要模型中融入文本的隐式主题信息,使其能生成尽可能覆盖原文主题的更高质量摘要。本文的主要研究工作如下:第一,现有模型大多采用文本的主题关键词或关键句来引导摘要模型生成符合主题的摘要,但现有技术往往无法完整地抽取出原文中的所有关键词,且抽取出的多个离散关键词并不能诠释文本中相关重要信息与主题之间的语义联系。同时,仅利用关键词也易导致忽视文本中更深层次的语义信息,尤其是隐式主题信息对摘要生成的引导作用。因此,本文提出通过变分自编码主题模型获取文本的隐式主题信息,进而将其融入到指针生成摘要模型的注意力机制中,改善摘要模型的解码输出结果,使模型能在全局隐式主题信息的指导下生成更符合主题语义的摘要。在中文单文本自动摘要公开数据集NLPCC上的实验结果验证了所提模型的可行性。第二,文本中往往蕴含了多个不同的子主题,且不同子主题的分布存在较大差异,另外文本中的每个词也与不同子主题具有不同的关联度,因此在摘要生成过程中若能区分利用不同词语相关的子主题信息,则有望进一步改善摘要的生成质量。鉴于此,本文提出引入隐式主题信息注意力机制以获取当前时间步摘要模型对所有子主题的注意力分布,从中选取出对当前生成最相关的子主题信息来引导摘要生成。与全局隐式主题信息相比,隐式主题信息注意力机制的优势在于可灵活获取并区分利用不同时间步的相关局部主题信息,具体将当前时间步的隐式主题信息上下文向量融入到词表概率分布中以获取最终的解码生成。此外,鉴于人工标准摘要往往具有较好的文本关键主题覆盖度,因此我们还提出了在模型的训练阶段引入标准摘要的主题信息,以此来加强对无关信息的过滤与筛选。在中文单文本摘要公开数据集NLPCC上的实验结果及分析验证了该方法的有效性。
其他文献
目的:探讨医患沟通教育在口腔修复学教学中的应用效果。方法:将口腔修复科实习的五年制口腔医学本科生随机分为2组:实验教学组(n=25)采用医患沟通教育融合常规教学模式;传统教学组(n=25)采用常规教学模式。利用医患沟通行为量表测评,教学效果调查问卷比较两种教学模式的效果。结果:实验教学组医患沟通能力优于传统教学组(P<0.05),医学生也更喜欢融合教育模式(100%)。结论:将医患沟通教育融入口腔
高考是人生一个重要转折点,是对学生十几年寒窗苦读学习成果的检测。因此高考不仅具有选拔功能,也发挥着指挥棒的作用,指引着教师的教和学生的学。因此历年高考试题一直备受研究者的重视!新课改提倡“以学生为本”,重视并培养学生的核心素养,纵观自1977恢复高考以来的化学试题,不难发现,高考化学试题逐渐由原来的知识立意过渡到了能力立意,从以前的重书本知识转变成现在的重理论联系实际,注重用所学知识解决实际问题的
目的 探讨翻转课堂联合三维可视化教学在住院医师规范化培训脊柱外科带教中的应用效果。方法 选择2019年9月至2020年9月山东第一医科大学附属临沂医院脊柱外科34名住院医师为研究对象,随机分为观察组和对照组,观察组17名住院医师采用翻转课堂联合三维可视化技术教学,对照组17名住院医师采用传统教学方法进行授课讲解。结果 两组住院医师入科考试成绩、出科时基本理论知识成绩差异无统计学意义,但观察组住院医
磁场作为基本物理概念备受关注,其测量技术在生物医学、空间航天以及军事等领域得到了广泛的应用,铯原子光泵磁力仪由于具有灵敏度高、体积小、功耗低等优点,在磁场测量领域越来越被重视。新型矢量铯原子磁力仪与传统磁力仪相比,可以对磁场的方向进行测量,更易感知磁场的变化,目前国内的原子磁力仪大多停留在标量磁力仪上,对矢量原子磁力仪的研究处于理论探索阶段,本文就实现新型矢量原子磁力仪的关键技术展开研究。本文基于
城市更新,又称城市再造和都市活化,它和旧城改造就像双生花,纹理花色略有不同,但又有诸多联系,系同出一支。城市更新旨在完善城市功能、优化产业结构、推进土地资源的节约、集约利用,目前主要以城中村、旧商业区、旧工业区为重点;而旧城改造旨在消除危旧住房和道路,改善片区居住环境,完善基础设施配套和公共服务设施配套。
《普通高中数学课程标准》提出的六项核心素养,为高中数学教学制定了总课程目标。学生在接受的学科教育过程中所形成的思维能力与数学品质就是核心素养。它不仅仅是学习基础知识,基础理论,而是在学习过程中,通过教师的引导,使学生形成高于理论的思维方法。但是它又不能脱离的基本知识与方法单独存在,而是在教师的教学中,通过学生的积累和探索,变成自己的领悟、内省而成。当今的高考命题原则之一就是要求体现数学核心素养,那
根管治疗术是目前国内外学者广为认可和推崇的治疗牙髓病和根尖周病最主要的方法。虽然根管治疗技术方法已经很成熟,但由于各种各样的原因,在治疗过程中仍然存在许多失误和并发症,影响治疗效果,甚至导致治疗失败。因此,医师在临床操作中应有认真、警惕的态度和精心、细致的技巧,尽量避免操作失误和并发症的发生,一旦出现意外,应采取有效措施尽量控制并发症的影响。本次课程主要结合临床实践,对根管治疗中常见的如:急性根尖
本研究以小学高年段数学为例,探讨微课对小学高年段数学教学的辅助作用。本论文的研究紧密结合小学高年段学生普遍的身心发展特点以及这一学段数学教学中的具体内容,结合已有的理论基础和较为成熟的现代信息技术,依托我校现有的教育教学设备设施资源,摸索设计适合辅助小学数学高年段的微课教学学习资源,最终达到优化教学、激发学生学习兴趣,提高课堂教学质量的目的。本文第一部分是绪论部分,这一部分介绍了本研究的研究背景、
随着大数据时代的来临,人们开始意识到餐饮业的数据积累没有得到充分的利用。就高校而言,教育大数据、教育数据挖掘日渐受到重视,食堂窗口校园一卡通刷卡数据作为教育大数据的重要组成部分开始受到广泛分析、挖掘与利用。如今食物浪费已经成为全世界普遍的问题之一,为了避免高校食堂出现严重的食物浪费问题,响应习近平总书记提出的“光盘行动”号召,利用高校食堂各窗口校园一卡通刷卡数据建立精准的窗口销量预测模型显得十分重
房地产企业的业务范围比较广,市场变化也比较频繁,企业面临的经营风险和财务管理风险比较大,对于这种局面业财融合可以有效提高企业运营效率,降低企业所面临的风险,对企业发展有重要意义。本文就房地产企业业财融合存在的问题进行探讨,并提出对应的解决措施,希望能给相关研究人员带来思考。