一种改进的TextRank关键词提取算法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:ysminnpu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词提取在自然语言处理领域有着广泛的应用,如何准确、快速地从文本中获取关键词信息已经成为文本处理的关键性问题。现有的关键词提取方法很多,但是这些关键词提取方法的准确率和通用性有待提高。因此,提出了一种改进的TextRank关键词提取方法,该方法使用TF-IDF方法与平均信息熵方法计算文本中词语的重要性,然后根据计算结果得到词语的综合权重。利用词语的综合权重改进TextRank算法的节点初始值以及节点概率转移矩阵,通过迭代的方式计算各个节点的权重,直至收敛,从而得到词语的权重信息,选择top N个词语作为
其他文献
传染病疾病谱不断变化,经典的传染病现已少见,新发现的传染病又往往呈地区流行,没有真实的临床感知,仅靠传统的单一教材施教显然不能满足传染病学临床教学的需要。如何编写适
健康评估课程是连接基础医学和临床护理课程的桥梁,要求学生不但熟悉相关理论知识,还要掌握一定的操作技能。基于体验学习圈的健康评估实训教学通过具体体验、观察反思、概括
刘复先生曾考证董说一生事迹 ,并写下长文《〈西游补〉作者董若雨传》。在论及董说的著作《楝花矶随笔》时 ,刘先生说 :“要研究若雨一生的事迹 ,这是一部极有用处的书” ,“
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
历史教学使德育教育、素质教育的重要组成部分。作为我国专业技术人才培养的重要基础,中专历史教学是我国专业技术人才德育培养、素质培养的关键。针对中专教学中历史教学现
对于起早贪黑的上班族来说,咖啡的存在可以说是"曾经用来消遣,现在用来保命"。在城市的各商圈中,星巴克、Luckin等咖啡店络绎不绝;在写字楼里,咖啡机几乎已成标配。有数据统
<正> 改革旧的体制,建立新的体制,是一次极为深刻的革命。认识改革的必然性是一回事,能否真正实现改革则是另一回事。从历史上看,改革的失败,大致有两种可能:一是被反对派所
结构组稀疏表示(structural group sparse representation,SGSR)算法对结构组的估计值进行奇异值分解得到字典,然后用Split Bregman Iteration算法求解优化模型得到稀疏解,最后借助字典和稀疏解来修复图像。该算法在一定程度上解决了传统稀疏表示算法忽略图像块之间相似性导致重构图像的结构和纹理不够自然的问题。但该算法中,结构组的估计值采用双线性插值
简要介绍赴美人工林经营技术培训考察基本情况,着重介绍了美国人工林经营中的林木育种、苗木生产、集约经营和产学研结合等情况,并结合我国人工林经营管理现状,提出提高我国人工
用隧道式活化炉取代焖烧炉生产活性炭的试验结果表明:按照活化工艺温度850℃,时间36 ̄60h,粉状活性炭产品质量可达到部颁标准,颗粒活性炭延长活化时间,产品质量可达到载体炭的质量,隧道窑焖烧