基于机器学习的产品评论情感分类研究

被引量 : 6次 | 上传用户:tzl1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展,人们越来越多的从网络上获取各种信息,判断这些信息的褒贬倾向受到了许多研究者的关注。情感分析可以用来对社会舆情、产品评论、微博中反映的观点进行分类,提取出文本中的褒贬倾向,从而促进人们对某一事物的理解。本论文主要着重于产品评论的情感分析,对网上的产品评论进行分析,从而得出人们对这个产品的褒贬倾向。一些研究者已经应用无监督学习来计算产品特征的情感值,并取得了不错的效果。在文本级和句子级的的情感分析中,监督学习也得到了广泛应用。在本研究中,无监督学习和监督学习将会被同时用来对在线产品评论进行情感分类。首先,编写了一个爬虫程序从京东商城上提取出正、负各3321篇关于三星手机19100的评论,接着对评论进行去重、分词、标注等预处理,提取出其中的情感词,并使用结合HowNet褒贬义词和网络词汇,构建一个面向手机评论的情感词典。然后,在监督学习中,提取出形容词、副词、语言规则等作为特征项,构建一个特征空间,并使用信息增益(IG)和互信息(MI)对特征项进行筛选,去除冗余信息,并使用LIBSVM分类器对文本进行正负极性分类;在无监督学习中,把否定规则、强化规则和连词规则用于情感值的计算,通过运用语言规则来提高情感计算的准确性。最后,设计了一个基于无监督学习和监督学习的手机评论情感分类系统,通过监督学习的方法对文本进行正负分类,并利用无监督学习来计算每个评论的情感值。结果表明,把语言规则用于特征空间的构建可以提高特征空间的性能,从而影响到分类的准确率;把无监督学习和监督学习结合在一起不仅能得出评论的正负极性,并能把每个评论的情感强度量化出来,取得了较好的实验效果。
其他文献
针对某型号机在弹塑性理论和逆向工程的基础上,采用普通铆接方式,通过计算和数值模拟对铆接的夹具进行优化设计。结果表明,此夹具的优化设计可使铆接后的干涉量均匀度大大提
在现代城市生活中,自然灾害、突发事件等不可抗性事件频繁发生。突发事件包括交通事故、工业生产事故(如有害气体泄露、火灾、爆炸等)、恐怖袭击事件等,其发生具有不可预测性
目的系统评价体外受精-胚胎移植(IVF-ET)治疗中短时受精与常规受精两种受精方式的临床效果。方法计算机检索Pub Med、h e Cochrane Library(2014年第8期)、EMbase、CBM、CNKI
①目的了解冠心病患者健康自我管理现状及其影响因素,为采取相应的干预措施提供参考依据。②方法采用冠心病自我管理量表、日常生活能力量表、家庭功能问卷、社会支持评定量表
随着经济的发展,农民的消费潜力逐年增加,农民的消费潜力对促进农村经济的发展具有重要的作用。本文在界定农民消费潜力概念的基础上,利用对河北省农民的调查数据,通过建立影
在采用收益还原法对研究区农户水田、旱地样本经济产出价值进行核算的基础上,运用相关分析和C-D生产函数考查农户行为对耕地经济产出价值的影响作用情况,并根据行为动机理论
河口滩涂位于江河入海口前沿,其岸线受江河上游来水来沙、海水潮汐动力和人为因素影响处于不断变化中。针对遥感人工目视解译判读出岸线进行冲淤变化分析方法的不足,提出了面向
针对碳纤维固定的高速分块表贴式永磁同步电机(SPMSM)的转子强度缺乏解析解的问题,基于平面应力模型,采用极坐标下的位移法和应力函数法,推导了考虑永磁体和极间填充块密度及
目的:了解我国市售婴幼儿谷类辅助食品可选择营养成分添加情况和含量分布,为修订《婴幼儿谷类辅助食品》(GB10769-2010)可选择营养成分提供参考依据。方法:通过线下实体店和
<正>闻一多(1899—1946)我国优秀的诗人、学者和民主战士.他于1922年,赴美留学,在那里读了许多西洋古典文学名著和浪漫主义的文艺作品.使他成为一个唯美派的诗人.1928年秋以