论文部分内容阅读
随着全球化的加深,品牌在决定企业竞争力方面起着重要的作用,如何对品牌价值进行合理量化,以达到提高企业竞争力的目的值得思考。传统的品牌评估方法通过调查问卷或者统计品牌的利润、销售额等市场数据来综合分析品牌。然而这些方法没法全面的分析海量消费者对品牌的观点和态度,也没法直观的展示观点。基于情感分析的线上品牌评估系统通过提取海量消费者对品牌属性评价数据的观点,分析消费者观点的情感倾向性,进而帮助企业调整生产策略。情感分析目的是通过分析文本判断用户对商品或者服务的看法和态度,将态度划分为褒扬、贬义、中性等。主要研究方法有无监督学习方法和有监督学习方法。其中,无监督学习通过使用非标注样本进行情感分类建模,情感分类模型的效果依赖于特征集合;有监督学习方法使用机器学习方法进行标注样本的训练,可扩展性强。本文中采用的是有监督学习方法,但是区别于常用的特征提取技术,本文采用的特征融合的方式提取特征。本文的主要贡献包括:1)本文采用两种方法提取特征,再将两种方法提取出的特征输入相同的分类器中,对比和分析两种特征的分类效果。一种是通过命名实体识别的方法提取特征;另一种是通过浅层与深层特征融合的方式。实验证明通过融合词向量提取的深度特征与CRF提取的命名实体的方法使得情感分类评测效果优于仅使用CRF命名实体识别的特征提取方法。文中对比支持向量机与逻辑回归两种分类器的评测结果,最终选择支持向量机作为情感分类模型。通过情感分析识别出不同属性的特征的观点倾向性后,对品牌的每个属性赋予不同的权值来计算品牌指数,并对比调查问卷计算的品牌评分,采用遗传算法不断迭代选择出与问卷评分高度拟合的权值体系,并应用于本文的品牌评估系统中。2)设计并实现了一个可以商业化的B/S架构的系统——基于情感分析的线上品牌评估系统。该系统将品牌的评论数据与品牌属性进行映射,统计品牌各属性的得分,与属性映射的评价数据好评率越高得分越高,得分低的属性是企业需要关注与优化的重点;将各属性赋予不同的权值,通过加权的方式计算品牌指数,并按照指数进行品牌间排名。品牌评估系统的核心模块,包括数据采集、数据预处理、情感分类和品牌评估模块。