基于微博文本情感计算的用户个性分析方法的研究

来源 :河北科技大学 | 被引量 : 2次 | 上传用户:honest1988li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,国内的各个门户网站不断探索和深化微博应用,使其汇集了大量的舆论信息,这些舆论信息包含了大量的情感信息。在微博等社交平台上进行文本挖掘,不仅可以分析博文的情感倾向,同时也可以根据用户的语言风格和用户注册的性别、年龄、地域、学历背景等信息来为用户构建相应的用户剖像。而在用户剖像的范畴中,个性分析是非常重要也是比较困难的问题。正确识别微博用户发表的博文情感倾向有助于政府收集民意,有利于商家调整营销策略,同时,用户画像在优化用户体验上、提高经济效益上都有举足轻重的作用。此外,情感分析和用户剖像属于语言学、计算机科学、心理学等交叉研究领域的重要研究课题。探究微博蕴含的情感倾向信息和构建合理的用户剖像具有重要的学术与应用价值。本文主要研究工作如下:1)提出一种基于LSTM(长短时记忆网络模型)的短文本情感极性分类方法,通过实验选取性能较好的文本特征化方法,并确定合适的隐藏层层数和各层神经元个数。然后通过大量的微博数据对此模型进行训练,最终把此模型的性能和支持向量机、贝叶斯网络等其他机器学习算法做比较。2)提出一种基于KNN算法的用户个性分类方法,首先以流行的心理学模型和个性分析知识库为基础,构建个性打分模型对用户的个性进行打分。然后选取合适的分数阈值为用户的个性分类,最终把分好类的用户文本数据作为KNN分类器的训练集,并通过实验找到使KNN分类器性能最佳的K值。3)在用户剖像方面,首先提出一种基于模型融合的用户性别预测方法,其次依据短文本情感分类器的预测类别概率量化短文本的情感值,并以用户为单位计算其情感波动程度。最终以皮尔逊相关度为代表,合理的分析用户的情感、个性以及用户属性之间的关系。在情感分析部分,基于LSTM情感分类器的平均F值可达到91.1%,在个性预测部分,基于KNN的个性分类器的平均F值可达到90.0%,在用户剖像构建部分,本文可以合理的计算出用户的情感波动、个性、性别、时间等因素之间的关系。所以,本文提出的方法具有一定的可行性。最后,对本文中存在的问题及下一步的科研工作进行了说明。
其他文献
煤炭企业在面临经济下滑的复杂环境情况下,必须致力于创新与变革;加强行业指导和政府监管是煤炭企业发展不可或缺的条件。
该文针对供给经济学的理论核心——减稅以刺激投资,提出了一个非常重要的问题:减稅获得的收入是否必然会被储蓄起来而不被用于消费?显然,这是减稅方案能否取得刺激经济增长、
<正>临床中药学是在中医药理论指导下,以临床用药为核心,研究中医辨证用药基本理论及应用规律的一门学科[1]。临床中药学课程是重点介绍中药学基本理论和常用中药的性能功用
目的探讨三伏天应用中药穴位敷贴治疗过敏性鼻炎的疗效及总结护理方法。方法将300例过敏性鼻炎患者随机分为治疗组及对照组各150例,对照组采用常规治疗方法,包括药物治疗和脱
学生评教是对教师教学质量认定的重要依据,但同时评价结果也会受到诸多因素的影响。通过数据挖掘技术中的贝叶斯算法,对北京中医药大学学生评教的原始数据进行实证分析,分别
随着科技水平的飞速发展以及当今社会对智能化要求的不断提高,近年来,人工智能领域迎来了前所未有的发展热潮,而作为其代表技术之一的视觉测量技术也将被更多的应用在生活的
随着Web2.0的发展,以微博为代表的社交媒体得到飞速发展,它们已成为大众日常生活中不可缺少的舆论交流和情感抒发平台。同时,由于社交平台的广泛应用,这里也汇聚了大量有意义
六自由度工业机器人代表着工业自动化的先进性,是工业生产中应用最多的制造装备。机器人的精度已经成为比较工业机器人性能好坏的关键指标,工业机器人精度分为绝对定位精度和
太阳能夏储冬采即利用土壤把春、夏、秋季节较为丰富的太阳能转化为热能储存起来。在冬季将储存起来的热能取出来为建筑供暖。实现了太阳能跨季节利用的目的。本文针对于太阳
随着互联网+时代的到来,信息技术在物流行业中广泛应用,作为涉及诸多行业的现代物流业更是对推动城市经济发展和提高城市竞争力有着十分重要的作用。它为企业提高经营利润和