基于改进TextRank算法的中文文本摘要提取

来源 :计算机工程 | 被引量 : 0次 | 上传用户:coolhongchacool
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重影响因子的TextRank算法对文本语句进行排序,并提取主题句生成摘要。实验结果表明,DK-TextRank算法在摘要语句数量为7时F值达到79.36%,相比传统TF-IDF、TextRank算法提取的摘要质量更高。
其他文献
<正>在今后3至5年时间内,能否保持稳定高效的经济增长,对于中华民族的振兴崛起至关重要。虽然我们面临入世的严峻挑战,面临着最为突出的就业和社会保障问题,但从总体上看,中
<正> 自1981年我国重新走上负偾经济道路以来,国债市场每前进一步都离不开银行的支持,中央银行是国债市场的组织者和管理者,专业银行是国债市场不可缺少的中介机构和投资者。
目的探讨热毒宁注射液治疗小儿疱疹性咽峡炎的临床疗效及安全性。方法将我院收治的68例疱疹性咽峡炎患儿随机分为治疗组37例和对照组31例,在常规对症处理基础上,治疗组应用热
由中国计算机学会(CCF)主办、CCF信息系统专业委员会和广州大学计算机学院共同承办的旗舰会议--第十七届中国信息系统及应用大会(WISA 2020)将于2020年9月23-25日在广州召开
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
加载核对于程序加载是必需的,其作用是把用户的程序调入主存,并完成初始化,然后覆盖自身,让主程序运行,这一过程称为系统加载。介绍了TigerSHARC-201加载核的原理;并对芯片厂
针对核相关滤波(KCF)跟踪算法在复杂环境下其定位性能和稳定性差的问题,提出了一种快速尺度估计的增强型多核相关滤波跟踪算法。该算法针对核相关滤波算法无法适应跟踪过程中目标尺度变化,将快速判别式尺度估计移植至核相关滤波跟踪框架,解决了跟踪过程的目标尺度问题。对于单个特征的单核相关滤波器在复杂环境中跟踪适应性差的问题,提出了一种多特征互补的多核相关滤波器。该滤波器利用KCF多通道特性以及不同特征可以描
目的探讨大肠癌p16^Ink4a和周期素(cyclin)D1的表达及其临床病理指标和预后的关系。方法应用免疫组织化学SP法检测大肠癌及正常大肠黏膜中p16^Ink4a和周期素D1的表达水平。结果
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技