网站商品评论挖掘技术的研究

被引量 : 6次 | 上传用户:spacelion
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网应用的迅速发展,购物网站、点评网站以及各种论坛上不断积累了越来越多的商品评论文本。在商品评论挖掘的研究中,基于方面的情感分析备受关注。从消费者的角度来看,不同消费者看重的方面会有所区别,基于方面的情感分析结果可以帮助他们选择更适合自己的产品。从商家的角度来看,基于方面的情感分析结果可以让商家知道其产品有哪些方面存在问题,可以帮助他们对产品进行改进。本文利用CRFs模型,对评论文本进行基于方面的情感分析研究,主要包括方面与评价词抽取、情感极性及强度分析、基于主题-方面的情感极性及强度分析结果总结三部分。关于方面与评价词的抽取,本文提出了基于LDA和CRFs的半监督方面词与评价词同步抽取方法。初始方面词与评价词集合从LDA主题模型的训练结果以及知网的情感词典中获取。在CRFs模型中,融合了统计特征(从LDA主题模型的训练结果中得到)、语义特征(词、词性、语气词、程度词、词之间的前后关系)以及方面与评价词的共现等特征,最终得到方面词抽取的F1值为71.7%,评价词抽取的F1值为55.3%。和有监督学习相比,本文的半监督方法能很大程度上减少方面词和评价词标注的工作量。因为是半监督,该方法还具有一定的跨领域性,如果应用到其他领域,需要做的额外工作很少。关于情感极性分类及强度分析,本文利用层叠CRFs模型,融合词、词性、语气词、程度词、方面和评价词的共现等特征,在情感句识别、情感极性分类和情感强度分析上得到的F1值分别为86.3%、77.2%、70.7%。关于意见总结,本文提出了基于主题-方面的情感极性及强度分析结果总结方法,并实现了一个评论挖掘系统,对挖掘效果进行了直观的展示。
其他文献
铰接销轴作为铰接车辆关键零件之一,其在车辆设计中经常出现强度不足现象,为此采用有限元方法对其分析计算,动态模拟车辆在平面路况及颠簸路况下的受力状态,分析其应力随时间
在传统教育中,知识的掌握取代思维的发展,成为教育的最终目的。然而。在知识和思维之间,知识本身并没有价值,知识的价值存在于"解决问题"的过程中。因此,走出传统教学的出路
对水下振源体的滚动密封圈密封不严问题产生的原因进行了分析,选择高抗结晶性能的氯丁橡胶DCR114和DCR213并用(75/25)代替原来的氯丁橡胶CR232,通过了硬度变化试验,改进后的
<正>首先,我们要想抓好教师队伍建设,提高教师的道德修养,就要做到明目标,定制度,促师德。诚然,师德教育是我们教师队伍建设的一个重要内容,同时也是一项长期的任务,不能急于
上海人口增长的规划控制目标,从根本上取决于其人口承载量的拓展潜力。区域人口承载能力研究,所面对的是由人口、资源、环境、经济和社会构成的复杂巨系统,必须充分重视研究
原告胜诉奖励机制是一种以原告为奖励对象的激励手段。在环境民事公益诉讼中引入原告胜诉奖励机制可以解决我国环保组织资金难的问题,从而改变多地环保法庭"无案可审"的尴尬
期刊
近年来,海峡两岸经贸往来快速增长,合作程度呈提高趋势,但从总体来看,两岸合作水平还很低,原因主要在于台湾当局对两岸金融往来采取的态度、内地金融法律的不完善、人民币与
<正>三十多年前,我住的小镇上有个杀猪的屠夫,后来他不想干屠夫了,想扮成治病的中医。于是,他放下屠刀,走了上千里路,在那个陌生的地方,编了瞎话,改了自家的历史,把自己打扮
期刊
北欧五国是指:挪威、丹麦、冰岛、瑞典、芬兰这五个国家。五国的历史背景紧密相连,社会制度和政治制度也十分相近。19世纪以来,随着两次女权运动的兴起,北欧五国的女性的自我