基于回应消息的微博情感分类研究

被引量 : 0次 | 上传用户:mi33123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网Web2.0技术快速发展,微博成为继博客之后当下最流行的社交应用。微博以其方便、自由的形式,短期内便吸引了大量的网民。数以亿计的网民每天通过微博平台发布微博消息,这些海量消息均是来自网民自己的声音,含有丰富的情感内容信息,可以通过挖掘这些情感内容信息来了解网民对社会热点事件、政府政策的态度,为用户、政府或企业提供决策支持。本文以新浪微博作为研究对象提出了针对中文微博的情感分类方法,主要做了以下工作内容。第一,本文使用采集的新浪微博消息,从统计学的角度对新浪微博消息内容长度、句子个数及微博中包含的链接、话题标签、表情符号、图片进行了定量分析。这些内容的分析和对比是分类方法中特征提取和算法设计的重要参考依据。第二,本文从语义规则角度提出了基于微博词典和回应消息的微博情感分类方法。该方法通过构建微博情感词典,结合回应消息对微博进行情感分类,同时对引入的回应消息设计了可度量计算方法。另外,又提出了回应消息可信度的概念,主要用来衡量回应消息的真实性。第三,本文从机器学习角度提出了基于语义特征和回应消息的微博情感分类方法。该方法通过提取微博语义特征、微博元素特征及回应消息特征,利用向量空间模型表示分类特征向量,结合SVM分类算法实现分类模型,实现对中文微博的情感分类。最后,本文使用新浪微博作为训练和测试数据,针对提出的方法设计了多组实验,详细对比分析了各组实验结果。得出的结论是本文提出的分类方法是可行和有效的。
其他文献
<正>2016年,一个从英国而来的小猪形象在中国爆红,它的名字——小猪佩奇,是一部宣扬传统家庭观念与友情的教育类动画片中的主角,该片2015年底进入中国市场,很快播放渠道就不
期刊
<正>三清山古老珍稀植物类群的聚集不是几个世代就形成的,它们一个个从起源地迁移到这里,可能还经过很多次扩散和回迁,才形成了当前的群落状态。各个类群间也经历过可能几百
区块链这一革命性技术给传统法律监管带来前所未有的挑战,采取何种监管策略与态度已成各国当务之急。依照不同区块链应用对国家合法利益的威胁性不同,传统法律与区块链系统内
东海原甲藻是我国东海常见的大规模赤潮肇事种。目前,大量文献报道环境因子(温度、盐度、光照)对其生长的影响以及其对营养盐的吸收利用,为其大规模爆发的生理生态学研究提供
设计了波段300nm~500nm,放大倍率为10×,NA=0.3的近紫外-可见光显微物镜,用于观测激光照射核聚变的成像过程。该系统采用透射式结构,通过P、W设计方法和CODE-V软件的优化,实现
目的模拟临床放射治疗过程,建立大鼠放射性肺损伤模型,通过研究大鼠肺脏组织学改变和细胞因子的动态变化,观察放射性肺损伤的中医证候特点,评价凉血活血中药的治疗作用,并探讨其作
本文从古今两方面探讨了中医对COPD病因、病机、辨证分型、治疗方法的认识;总结了现代医学对该病发病机制及治疗的研究现状。结合导师多年实践的临床体会,在中医理论指导下,提出
采用透射电子显微镜(TEM)、纳米粒度仪、X射线衍射(XRD)和傅立叶红外光谱(FT-IR)比较研究了正常人与尿石患者尿液中纳米微晶的形貌、尺寸、分布及其化学组分。正常人尿液中纳
<正> 一、引言我们知道在有关书刊的某些文章中已清楚的阐明了复消色差的结构及其设计方法,根据这种方法所获得的结果一般是焦距较短,有较