中文微博产品评论中的情感分析方法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:cderfvbgtyhnmj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了了解消费者的消费满意度,可以通过问卷调查和电话随访的方式进行,但这种抽样调查不能代表所有消费者的消费满意度,搜集数据本身不具有代表性。社交平台网络的用户较多,可以储存大量的用户体验信息,而这些微博内容能够打破时间、空间、年龄、职业等的局限性,较好地反映出用户的兴趣爱好和情感思维。因此,从用户微博评论中获取用户的情感状态、偏好,找出用户的兴趣点,可作为商家提供发掘潜在客户群体的依据,便于有的放矢地进行产品营销及市场推广。微博文本和传统文本的差别性较大,内容短小精炼并且口语化;没有严格的语法限制,而且可能存在病句。了解这些微博文本的特殊性,根据二者的异同之处,改进传统文本分析方法,研究合适的中文微博产品评论情感分析方法,提高识别精度。本文的工作主要包括情感倾向分类、分类算法、情感信息的检索等内容。主要研究工作包括以下几个方面:构建基于句法依存关系和文本分类的微博产品评论情感分析模型,进行随机森林和支持向量机分类算法的性能比较,选择置信度高的训练样本集,选择微博表情符号并进行标注训练样本集;提出利用句法依存关系和文本分类相结合的情感分析算法,特别是将随机森林分类算法应用于文本分类,并进行实验分析,主要包含预处理、评价词及评价对象抽取、情感倾向性判别等,对微博产品评论文本中蕴含的情感进行分析;设计了中文微博产品评论情感分析的系统,阐述了系统的设计和研发过程,包括数据收集子系统、数据处理子系统和数据展示子系统的设计和实现;最后对系统进行了测试,主要包括测试环境的构建、测试结果对比分析,最终确定真正有效的微博产品评论情感分析模型。本文中所论述的微博情感分析算法,是在中文词法、句法分析基础上结合文本分类而构建的,最终研发出的情感分析系统测试后主客观句识别可达到88%的正确度,情感倾向性识别准确率能达到71%。
其他文献
目的了解某部官兵个性特征对心理健康状况的影响。方法用症状自评量表(SCL-90)和卡特尔16项人格因素问卷(16PF)对1 204名官兵进行测试及相关分析。结果某部官兵心理健康水平
<正> 尼群地平(Nitrendipine)是一种抗高血压新药,属于第2代钙通道阻滞剂,副作用少,目前广泛应用于心血管疾病的治疗,我们最近遇到此药引起的不宁腿综合征(Restless Leg synd
家校合作指的是学校和家庭之间相互配合来促进学生德、智、体全面发展的一种教学活动;心理健康教育是一种新兴的学校教育活动,旨在提高小学生心理素质,帮助小学生建立健康、
<正>随着社会经济的发展,商业银行传统零售信贷业务正受到新的挑战:人口红利消失导致全社会的总体需求下降;城市化增长速度减慢,产业深化减缓降低产业内贸易导致信贷需求降低
随着经济的飞速发展,超市作为一种新的商品零售模式在我国发展迅猛,超市行业的发展是市场经济商品流通领域崛起的一股新力量,为中国第三产业的发展注入了新的活力。本文概述
<正>随着时代的发展以及社会主义市场经济的飞速进步,社会的竞争已经逐渐转变为人才的竞争,这给素质教育带来了更多的挑战和任务。心理健康教育与德育工作都是素质教育的重要
中欧共同且最大的利益是可再生能源在全球的迅速推广,努力实现全球气候保护目标。建立有序竞争,需求强劲的全球光伏市场符合这一利益。而中欧光伏贸易摩擦不仅对处于全球不同
"经济新常态"下,个性、多元化的消费方式是促进我国经济中高速发展的重要保证,消费与经济增长的关系是经济学的一个热点研究问题。本文基于1952年—2011年我国经济增长和居民
通过电泳回收的方法对克氏原螯虾(Procambius clarkii)的卵黄蛋白进行了纯化,鉴定结果显示总分子质量为481ku,具有6个亚基(198,176,132,11l,92,82ku);染色分析表明该蛋白是一种糖脂磷类胡
建立ARDL(自回归分布滞后)模型,分别对1978—2014年中国财政赤字率、名义利率及贸易开放度与通货膨胀之间的长期均衡和短期调整关系进行分析.边限协整检验表明通货膨胀水平与