社交网络中基于集对信息熵的情感分析研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:fntshb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析是热点挖掘、舆情分析、产品推荐的基础。Web2.0时代在以用户参与、主导、建设的基础上,形成了具有丰富情感信息的社交网络。考虑社交网络中文本短小、表情符混合的特点,传统的情感文本分析方法适用性较低。本文基于集对分析理论,结合信息熵,对社交网络中情感分析进行深入研究,主要内容如下。首先,将文本进行全切分,判断组合置信度与阈值的大小,确定是否有新词发现;通过正向、逆向相结合的双向最大匹配法,进行文本切分;根据描述字与字之间联系紧密程度的t检验解决歧义问题,在一定程度上保证分词的正确率。其次,将用于描述信息混乱程度的信息熵与集对分析相结合,提出集对信息熵SP-IE算法,进一步分析差异度系数,将用户个体的文本情感分为强积极、弱积极、不确定、弱消极、强消极五类。社交网络平台为用户提供了丰富的表情符系统,通过将抓取的表情符号转换为其携带的文字含义,再进行用户个体的情感文本、表情分析;并将SP-IE算法与HowNet算法从精确率、准确率、召回率以及F值四个指标进行对比,验证SP-IE算法的有效性。最后,基于传染病SIR模型,引入外来“免疫用户”,提出改进的SIRE模型;基于Python爬虫和SIRE模型,对情感分析进行预测,通过对比SIR模型与SIRE模型的拟合结果和预测结果,验证分析SIRE模型的有效性。
其他文献
随着城市化和工业化快速发展,建设用地集约利用成为必然趋势。本文以宁夏回族自治区吴忠市为例,结合国内外建设用地集约利用相关研究成果,建立适用于吴忠市的建设用地集约利
高职院校一直以来都以培养与社会岗位相匹配的人才为目标,为了为我国的社会主义建设输送更多的人才,高职院校进行了很多的改革尝试,采用多种方法积极构建人才培养模式。但是
根据2011年GOLD[1]新定义:COPD是一种可以预防和可以治疗的常见疾病,其特征是持续存在的气流受限.气流受限呈进行性发展,伴有气道和肺对有害颗粒或气体所致慢性炎症反应的增加
随着信息化的发展,高校纸质考核方式逐渐不能适应社会的发展,尤其是面对一个学期有好几千学生的公共课程,采用纸质考核方式极大的增加了教师的判卷等相关工作量,如果采用在线
<正>楼宇经济是近年来我国城市经济发展中涌现的一种新型经济形态,能够将城市发展空间由平面拓展为立体,突破了中心城区土地资源匮乏的空间限制,拓展了城区经济发展的空间,是
法门寺供养佛祖衣物是在法门寺地宫中出土的唐代帝后赐献供养佛祖的丝绸服饰制品.其中有一套案裙、半臂、裙子、袈裟、拜垫共五件按比例缩小的蹙金绣衣物供奉品,面料采用了丝
岩体初始地应力场是地震预测和岩体工程设计的重要依据之一,根据实测地应力资料,采取一定的数值分析方法,反演出整个计算区的初始地应力场。本文综述了国内外地应力场的研究现状
历史的际遇造就了艺术创作。2012年,教育部和中国科协发起"共和国的脊梁——科学大师名校宣传工程",旨在宣传中国高校中的著名科学家,弘扬他们的科学精神和报国情怀,为万干学子
中国高等教育源远流长,从古至今有着悠久的高等教育思想文化传统。理性看待中国高等教育的历史继承性,正确把握中国高等教育思想文化传统的核心内涵,客观认识中国高等教育思
<正>1研究目的大学生是国家未来建设的栋梁,在大学时期养成良好的体育锻炼习惯并积极参与健身活动意义重大。然而大量数据表明,大学生群体在接受了长达十几年学校体育教育之
会议