基于词向量与TextRank的关键词提取方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:ansonx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对词汇语义的差异性对TextRank算法的影响进行了研究,提出一种基于词向量与TextRank的关键词抽取方法。首先,利用FastText将文档集进行词向量表征;其次,基于隐含主题分布思想和利用词汇间语义性的差异,构建TextRank的转移概率矩阵;最后,进行词图的迭代计算和关键词抽取。实验结果表明,该方法的抽取效果相比于传统方法有明显提升,同时证明利用词向量能简单而有效的改善TextRank算法的性能。
其他文献
目的建立在线固相萃取(SPE)预处理的高效液相色谱法,检测血清中氯氮平浓度。方法以乙腈、超纯水、H2O(100 mM NH4Ac)作为流动相,采用梯度洗脱的原理,将血清中氯氮平经SPE柱前
在当前的科学背景和经济基础下,药品行业在社会环境下发展比较迅速。就目前的社会发展趋势下,我们国家的质检部门对药品行业的监察规格更上一层楼,这就需要尽可能的提高药品
<正>"中国诗坛1986’现代诗群体大展"(以下简称"大展")是20世纪80年代一场声势浩大的诗歌运动。通过仪式化的方式,第三代诗歌作为一个整体强行登上历史舞台。对于"大展"的评
现代住宅小区在很多城市已慢慢发展成为集办公与住宅为一体的综合性小区。分析住宅综合性小区的供电、综合布线系统、网络与通信系统、办公自动化系统、安全技术防范系统、建
英语颜色词的汉译已引起人们的广泛兴趣,人们对其中的文化引申含义或象征用法很重视,然而,相比之下汉语颜色词的英译却关注较少。本文就汉语颜色词的英译进行了研究。颜色词
歌剧《原野》自年首演后,年来成为全国各大剧院常演不衰的剧目。如今对于《原野》的研究方兴未艾,但对其咏叹调音乐语言的研究仍不系统、深入。笔者从主题的多样性与非角色化
目的观察经颅磁刺激治疗仪治疗抑郁症睡眠障碍患者的临床疗效。方法将160例抑郁症睡眠障碍患者随机分为观察组、对照组各80例,两组均采用常规治疗;在此基础上,观察组加行经颅
当前技术进步对计算机运算能力的要求越来越高,计算机必须以更大的功率以满足实际运用的需求。CPU、显卡发热通过传统风冷降温的方式由于能耗及噪音的因素已难以满足发展的需
目的探讨参附注射液对脓毒症心肌损伤的治疗作用。方法将72例脓毒症患者分为对照组27例,治疗组45例(治疗组)。两组均给予规范的常规集束化治疗(液体复苏、抗感染、氧疗等)。
知识密集型服务业的兴起是知识经济发展的必然结果,也是第三产业内部结构升级的必然趋势。本文通过研究,对知识密集型服务业概念进行了界定,总结出其不同于传统服务业的特征,