基于TextRank的产品评论关键词抽取方法研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:zhouxiaorong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词抽取技术能从海量产品评论文本中挖掘出用户关注的焦点,方便后续为用户推荐合适的产品。经典关键词抽取算法TextRank在迭代计算词汇节点的重要性得分时,忽略了邻近词汇节点的影响力差异。为此,提出一种融合TFIDF与TextRank算法(简称TFTR)抽取评论中的关键词。首先,通过引入用户浏览评论后给出的评论有用性反馈,提高有效评论中出现的重要词语权重,对TFIDF算法进行改进。然后将改进后的词频逆文档频率作为词节点特征权重引入到TextRank算法中,以改进词汇节点的重要性得分分配过程。实验结果表明,
其他文献
<正> 一、引言近十年来。三维地震勘探作为一种极有效的勘探方法已日益为国内外油气勘探工作者所瞩目。随着技术的不断进步。三维地震的应用范围越来越广,它所提供的丰富信息
光破坏防御机制是植物为应对复杂多变的自然环境而产生的保护措施,这些措施从形态、生理和生化等方面反映了植物对环境的适应能力。本文根据光抑制的机理,对近年来植物的光破坏
<正>简单来说,纳米技术包括以下三个方面:1~100纳米级的研究和技术开发;创造和使用因纳米尺寸所产生的新颖性能;具有原子尺度的操纵控制能力。纳米技术的最大吸引力在于纳米级
中国的城市化进程是一个异常复杂和艰辛的过程,近期全国范围的"民工荒"问题昭示农民工的城市化从理念到政策都有所滞后。为此,通过构建人口城市化效用模型,阐释了财富积累和
中式英语是指英语语言学习者,尤其是初学者,由于长期受到母语汉语言的影响,在英语语言交际和使用中出现的不合乎英语规范或英语语言文化习惯的一种畸形英语。对英语国家的人
<正> 我厂已有40多年的生产历史,是生产各类糖果、饼干、糕点制品的中型食品企业。1983年完成工业总产量1,700万斤,产值1,200万元,实现利润160万元。 1980年,我厂开始与四川
<正>2007年4月13日深夜1时左右,河南省南阳市卧龙区僚河乡钢筋拔丝厂的一台S7—250/10型配电变压器,低压侧的剩余电流动作保护器突然跳闸。因后半夜
为促进三角梅新品种在广州人行天桥、立交桥绿化的应用,进行了9个三角梅品种的嫩枝扦插繁殖试验,发现巴特三角梅品种‘重苞大红’和‘金边玫红’较易生根。木屑适合作为‘樱
<正>1.心病疗效水平的现状心血管疾病主要是冠心病,其发病率和死亡率均在逐年递增,是新世纪中危害人群9大病种中的"罪魁"之一,成为国内外医界、中西医同仁研究的热点和攻关的
会议
关于毛姆及其作品《刀锋》的研究,学术界长期以来都把研究重点放在小说主人公拉里的分析上以及小说的叙述特点上,本文认为,该小说融合了现实主义与现代主义的特征,毛姆对《刀