基于TextRank的关键词提取改进方法研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:p6688718
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于TextRank的关键词提取方法主要考虑文档的语义信息,没有考虑到文本的结构信息,导致关键词提取的准确率较低。为了得到更好的关键词提取效果,论文对新闻语料库关键词提取方法进行了研究,提出将文本的结构信息和语义信息相结合。基于TextRank算法,利用文本的结构信息(词语位置、词语跨度)和词语相似度改变词语权重计算方式,进而提取文本关键词。将论文提出的算法与TF-IDF、TextRank、Word2vec+TextRank进行了对比实验,结果表明,从准确率P、召回率R、测量值F三个方面都取得了良好的实验
其他文献
无论产品智能,还是万物互联,并非一朝一夕就可实现。智能,在整个家电发展历史上,也是不断持续进化和升级的。只是随着基础环境改善,智慧家庭和产品距离普通消费者越来越近。
介绍了甲烷水合物的结构、相平衡性质和在自然界的赋存情况,以及为开采甲烷水合物而进行的钻探和深海开发技术,并探讨了开发甲烷水合物中的环境保护问题.
3月的阳光,洒满了安大校园。校园的石椅、石凳及假山、池畔,聚集着三三两两的学子,或絮语春风、或凝神沉思
作为国家治理的支柱与基础——财政,在我国推进深化改革的过程中需要重视财政预算管理工作,为保证财政工作有序的运行,应该采用科学的管控方法完成财政预算以及管理会计的工
目的 探讨CT导向下经皮肺穿刺肺癌射频消融(RFA)术的护理.方法对24例肺癌患者施行CT导向经皮肺穿刺RFA的过程进行配合与护理.结果本组患者术程顺利,其中3例出现气胸,经处理后消失,全部病例手术均成功.结论本术安全有效,积极配合与护理有助于手术顺利完成、及早发现并发症和处理。
混合数据通讯方式的提出对于地震勘探是一种全新的通讯理念,可以有效的克服由于山丘、沟壑等障碍物造成无线信号有效传输距离缩短,通讯信号盲区,解决在通讯过程中的丢码、误
王淑明,安徽无为人,20世纪30年代在上海加入中国左翼作家联盟,并担任宣传部长,在文坛上享有一定的声誉,为我国无产阶级文艺运动作出了自己的贡献;抗日战争时期赴解放区从事革
液压马达的故障具有非线性、复杂多样以及信号噪声多的特点,基于这些特点论文针对液压马达的故障诊断方法,提出了将T-S模糊推理模型与神经网络相结合的机器学习的研究。论文