基于义原相似度的关键词抽取方法

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:studyrec
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]将词语的语义信息引入TextRank算法中,改进关键词抽取效果.[方法]使用HowNet知识库提供的词语义原信息计算词语相似度,根据设定的相似度阈值构建语义词图和矩阵.之后将语义矩阵和共现矩阵加权,得到新的词节点转移概率矩阵.[结果]改进后的算法在短文本上表现优于传统TextRank、TF-IDF和LDA,F值分别提高了6.6%、9.0%和10.3%;在长文本上表现逊于TF-IDF,与TextRank差别不大.[局限]分词程序对复合词、新词和实体类名词识别效果较差,使算法抽取到残缺的关键词,导致F值降低.此外,义原相似度算法也可进一步改进.[结论]结合语义的TextRank算法使关键词抽取过程兼顾词语共现及语义关系,为短文本关键词抽取提供了新思路.
其他文献
期刊
王夫之在其史论著作中对诸葛亮做出了独特的评价。对于“隆中对”,不仅看到其积极地作用,也分析了其局限性,特别是对蜀后来北伐行动的束缚作用;联吴抗曹是诸葛亮的基本外交策略,由于蜀吴两方强硬派的作梗,毁盟的趋势也不断出现,诸葛亮与鲁肃事难而心苦;诸葛亮的个人品格和功业是值得肯定的,但其失误以及由此引发的危害也很明显。
[目的]针对用户类型多样性和推荐模型专一性的问题,提出基于用户行为自适应推荐模型.[方法]通过构建三层协同结构来规范推荐过程.第一层对用户分类,形成不同推荐通道;第二层
科学的岗位价值评估是构建绩效工资体系的重要一环,而由于评估专家对岗位理解偏差所带来的不确定因素会导致评估数据部分失真.文章以某科研事业单位薪酬改革中实施岗位价值评
屈指算来,在戏剧创作的道路上,自己已经走过了漫长的半个世纪了,虽无大成就,但是有一点是千真万确的,即喜欢戏剧,喜欢舞台,为了戏剧,全身心地投入.戏剧是个难圆的梦,自己是用
期刊
早先铁片大鼓在天津称乐亭大鼓,其唱腔是在河北民歌《初一十五庙门开》的曲调上发展而来,民国初年,京、津、冀的一些曲艺场所已有艺人演唱.其音乐属于板腔体,一板一眼,眼起板
期刊
空间艺术是舞台美术创作的重要组成部分,舞台设计者对于空间的气质往往拥有着特殊的敏感度,他们体会着空间向他们诉说的故去的历史,分享每一刻的荣辱兴衰,最终组成一种特殊的
[目的]提出一个用于多项选择机器阅读理解的多角度共同匹配模型,并探讨问题类型和答案长度对机器寻找正确答案的影响.[方法]使用多角度匹配机制获得文章与问题和候选答案之间
本文从社会建构主义身份观出发,结合语篇-历史分析法,借助语料库工具Wmatrix分别从宏观主题、中观沟通策略及微观语言特征三个层面对比了中美银行企业概况中身份话语建构的共
古筝是我国的传统乐器,一直以来都深受民众的喜爱,在当前经济水平快速提高的环境下,人们的精神需求也在逐步提升,如何进一步推动古筝艺术的发展与创新成为需要思考的首要问题。基于此,本文对当代古筝艺术的发展与创新展开分析,从古筝艺术的传统艺术特点出发,对当代的发展形势加以讨论,进而提出了提升古筝艺术的影响力、与传统艺术相结合以及加强古筝交流与合作等有效创新路径。