基于隐式产品特征的网络商品评论情感分析研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:lzt870702
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,商品评论已然成为了极具有价值的数据资源之一。对海量的商品评论信息进行挖掘是大数据分析中十分重要的内容。商品评论中蕴含着评论者对所评价对象的态度,对商品评论进行深度地挖掘能够发挥出巨大的商业价值和社会价值。为了得到更加科学和细化的决策依据,论文从产品特征细粒度出发,结合已有的研究基础和相关技术,研究了基于隐式产品特征的网络商品评论挖掘。主要工作为以下几点:1.针对中文领域的隐式产品特征识别,提出了一种采用复合规则的隐式产品特征识别方案。该方案将统计规则、依存句法和条件概率等规则结合到一起,充分考虑了句子中动词、名词、形容词蕴含的信息。采用手机评论数据对本文方案进行了检验,结果表明复合规则的采用,能更有效地发现评论中的隐式产品特征。2.对包含产品特征的主观评论句进行识别。通过将已有的情感词典和语料库中的形容词进行整合,扩充为一个新的情感词典。利用情感词典和句法分析工具,判断显式产品特征词与情感词是否在一定词距内共现并且存在依存关系来进行显式产品特征主观评论句的抽取。依据隐式句子中是否含有情感词对隐式产品特征主观评论句进行抽取。通过实验,证明了该方法的有效性。3.对主观评论句进行情感倾向分析,并按照产品特征簇对分析结果进行统计。论文提出了基于情感词典和多分类器集成的方法对主观评论句进行情感倾向判断。该方法利用基于情感词典的方法计算句子的情感倾向值,并将其作为依据从中选出部分句子作为已标注的训练数据集,避免了采用人工的方式来获取训练集。随后在自训练阶段中融入了集成学习的思想,在训练集上训练出两个有差异的分类器,综合两个分类结果对待分类的主观评论句进行褒贬义识别。本文提出的新方法能够有效地获取商品评论中产品特征的情感倾向,为客户提供更加详尽的决策依据。潜在的消费者可以根据挖掘结果做出更加科学和精准的购买决策,生产商也可以参照挖掘结果改进产品以满足消费者的需求。
其他文献
家庭是孩子成长的摇篮,家庭教育影响个体的身体发展、心理发展、社会发展,家庭中的诸多因素影响中师生的健康发展,这些因素有:家庭结构、父母的文化程度、父母的教养方式、父
[目的]通过评估造口患者一般人口学及疾病相关情况、适应水平、应对方式、自我效能、社会支持总体状况,全面分析探索造口患者适应水平的影响因素,旨在为制定及实施有效的护理
针对现有的基于密度的聚类算法存在参数敏感,处理非球面数据和复杂流形数据聚类效果差的问题,提出一种新的基于密度峰值的聚类算法。该算法首先根据自然最近邻居的概念确定数
交传技能训练的五大模块把口译过程中的理解、记忆、笔记、分析、转换和表达等按循序渐进的方式有机地组成一个承前启后的训练模式。这五大模块包括:双语口头表达、来源语单
利用工具辅助翻译也是翻译能力的一个方面。随着因特网的发展与普及,利用网络辅助翻译已成为当代译者一项不可或缺的技能。本文从辅助翻译的角度总结了网络的主要功能,并以第
职工文化水平不仅反映了煤矿企业整体文明水平,而且反映出企业的文化经营理念。因此,在煤矿企业中应该积极开展文化活动,通过丰富职工文化生活,使职工在活动中获得更多知识,
关于合同法定解除的损害赔偿制度,国内外的主流观点是并存主义,但是解释路径各有不同。我国《合同法》第97条确立了合同解除的损害赔偿,但是未明确损害赔偿的性质,也未限定损
<正>激励概念不止是奖励,还包括惩罚,属于"胡萝卜加大棒"的两手政策,且两者都要严格执行,才能树立起企业的威信。但在我国企业中,奖励和惩罚偏离现象较为普遍,硬激励和软约束
目的探究不同学历的实习生共情能力和情绪智力的分析。方法选择2016年10月—2017年9月在该教学医院实习的护理实习生100名,根据实习生学历的不同分为本科生组(n=52)和大专生
本文详细介绍了以美、俄国家为代表的外军当前空天作战现状及其未来的发展趋势。