基于混合机器学习模型的多文档自动摘要

来源 :情报理论与实践 | 被引量 : 0次 | 上传用户:ggg321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]信息过载是当前社会面临的普遍性问题,如何从大量的信息中提取有价值的内容,已成为研究的一个重点,目前自动摘要技术成为解决此问题的一种途径。[方法/过程]为了解决多文档摘要信息不全面、冗余度高的问题,文章提出了针对中文文本的多文档自动摘要混合模型,并对该模型所包含的句子向量化、分类器分类、句群划分和句子重组四个部分做了详细说明。该混合模型在摘要提取的过程不仅考虑了句子的形式特征,还融合了句子的深层语义,最后采用基于改进的PageRank算法对摘要句进行重组。[结果/结论]当摘要句为30时,该模型的ROUGE-1得分平均值为0.2074,明显高于TextRank (0.0728)和基于聚类的算法(0.1074)。实验结果表明该模型在多主题的中文长文本上是有效的。[局限]由于中文语料的限制,本实验的数据量相对较小,模型的适应能力未在大数据集上验证。
其他文献
目的探讨序贯性血液灌流(hemperfusion,HP)与连续性静脉-静脉血液滤过(continuous veno-venous hemofiltration,CVVH)治疗急性重度有机磷农药中毒(acute severe organophosph
厂房、仓库、飞机机库等建筑,因其门洞宽大,需采用钢结构大门。论述两种传统钢结构大门设计中的主要结构,并分析它们的特点。在分析传统钢结构大门的基础上,结合工程实际需要
英文广告语篇可以从多个层面,多种角度来分析,词汇重复模式分析便是其中重要的一种。通过对广告语篇实例进行词汇重复模式分析,可以得出这样的结论:中心句组与词汇重复项目成
结合教学实践中的体会对蓝墨云班课在应用过程中存在的一些问题进行探讨,旨在能更有效地应用蓝墨云班课提升教学效果和质量,从而为社会培养出更多高素质的优秀人才。
针对我国舰船上配备的灭火器因其工作环境的特殊性,不能很好地满足舰船灭火的要求的问题,分析我国现行船用灭火器的不足,分别从抗高温、耐低温、抗腐蚀、抗振动、抗冲击以及
邓小平关于“一国两制”构想的理论和实践意义张凤山一、“一国两制”在理论上的意义“一国两制”是全党全国对台工作的根本方针,也是邓小平理论的重要组成部分。邓小平说:“
功能性胃肠紊乱包括胃食管反流病。功能性消化不良,肠激惹综合征,大肠排便紊乱等。本文根据功能性胃肠紊乱定义而收治213例患者,男88例,女125例,从中按发病部位分析出食管功
目的探讨口服超常剂量降压药治疗主动脉夹层并发高血压的临床疗效及安全性,分析超常剂量使用降压药的合理性。方法将57例主动脉夹层合并高血压患者根据是否按推荐剂量使用降
目的:总结腹腔镜治疗卵巢皮样囊肿的手术技巧。方法:对108例腹腔镜治疗卵巢皮样囊肿手术处理和取物方法进行分析总结。结果:108例腹腔镜手术治疗卵巢皮样囊肿,其中48例采用直
<正>"礼乐"于夏商始,自周朝形成中华文明特有的文化体系。《礼记·乐记》:"乐也者,情之不可变者也;礼也者,理之不可易者也。乐统同,礼辨异。""乐"者,以音乐和舞蹈为基本含义,