【摘 要】
:
现有长文本自动摘要生成方法存在句子特征单一化和无法全面衡量句子相似特征的问题,导致摘要生成的准确率降低。为此,提出一种基于图集成模型的自动摘要生成方法。在计算得到
【基金项目】
:
国家自然科学基金(61802160),沈阳市新兴产业发展专项资金计划“辽宁省公共舆情与网络安全大数据系统工程实验室”[2016(294)]
论文部分内容阅读
现有长文本自动摘要生成方法存在句子特征单一化和无法全面衡量句子相似特征的问题,导致摘要生成的准确率降低。为此,提出一种基于图集成模型的自动摘要生成方法。在计算得到文本句子词频、语义和句法特征后,利用朴素贝叶斯方法将文本多维度特征的融合问题转化为图集成方式,提高句子间相似计算的准确性,并在此基础上通过TextRank算法生成文本摘要。实验结果表明,相比传统基于序列到序列模型的摘要生成方法和基于句子多维特征的摘要抽取方法,该方法取得了更高的ROUGE指标值,能够有效综合句子的多维特征,提高摘要生成的准确率。
其他文献
为增强时间卷积网络(TCNs)在时间特征提取方面的能力,提出一种基于三维密集卷积网络与改进TCNs的多模态手势识别方法。通过时空特征表示方法将手势视频分析任务分为空间分析和时间分析两部分。在空间分析中采用三维DenseNets学习短期的时空特征,在时间分析中使用TCNs提取时间特征。在此基础上引入注意力机制,使用时域维度的压缩-激励网络调整每个TCNs层特征在时间维度上的权值比重。分别在VIVA和
为了解决全彩色LED显示屏逐点色度校正存在的色坐标采集困难,显示控制系统性能下降等问题,提出一种亮色分离校正算法。以分辨率8×8为最小单位,实现单个像素点非标准色域
在医学研究中,生存分析是我们研究某种治疗方法或药物疗效的常用方法。生存分析的常用方法有Kaplan-Meier法(K-M法)、寿命表法、log-rank检验以及Cox比例风险(Coxph)模型等。
传统Ⅰ期临床试验用毒性指导剂量爬坡,试验目标是确定最大耐受剂量(maximum tolerable dose,MTD),通常需假定药物毒性和有效性随剂量单调增加。这适用于传统的细胞毒性药物,
泰尔指数(Theil index)来源于物理学,又称泰尔熵标准,是由经济学家Theil利用信息理论中熵的概念于1976年提出的评价公平性的指标。泰尔指数最初用于评价收入公平性,近年来在
无线传感器网络(WSN)在带状区域的部署过程中,簇头节点所转发的数据量与其离基站的距离成反比,容易导致网络负载不均衡。为解决该问题,提出一种优化的WSN节点覆盖方法。建立