中文微博的情感分析和影响力技术研究

来源 :解放军信息工程大学 | 被引量 : 6次 | 上传用户:xiaov705
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0中各种新型网络技术的出现,促使互联网飞速发展。网络体验已由单纯从网络获取信息转变为用户参与的新型模式。众多社会网络媒体平台凭借这种交互型理念迅速崛起,而微博无疑是众多异彩纷呈的平台群体中最具新网络时代特色的突出代表。微博中包含大量主观情感内容,对其经过处理后,可用于诸如商业产品口碑分析、民意倾向趋势预测以及舆情负面信息发现等众多实际应用中。此外对微博中的影响传播过程进行研究,了解传播过程中怎样的节点,凭借何种因素才能成为强力传播节点,对于舆情有效管控具有重大的意义。本文主要研究了中文微博的情感分析和影响力最大化估计,其贡献包括以下三个方面:(1)利用微博的内容和上下文信息进行中文微博情感分析研究,提出了一种基于树结构的中文微博情感倾向性分析方法。针对中文微博中出现的主谓缺失、书写随意、主题发散、情感漂移等问题,该方法首先对微博进行树集合结构初始化构造;然后,对数结构进行动态自调整;最后,利用动态自调整后的树集合对微博进行情感倾向性判断。实验结果表明,该方法有效地提高了分类准确度并改善了情感漂移问题。(2)微博文本的自身特点使得传统自动文摘并不完全适用于微博,本文提出了一种基于最短路径的中文微博情感文摘方法,针对中文微博中出现的微博数据量庞大、文本长度短、冗余量大等问题,该方法首先采用基于最短路径的子话题标签方法对微博内容的子话题标签进行抽取;然后,对情感特征进行抽取;最后,将子话题标签和情感特征结合起来生成情感文摘。实验结果表明,该方法可以有效降低信息冗余,增强文摘可读性。(3)现有影响力最大化估计主要是基于节点度的研究,本文将内容和情感信息加入传播过程分析中,提出一种基于内容和情感的微博影响力最大化估计方法。首先,抽取主题标签并利用抽取的标签对微博用户进行分类;然后,计算不同主题下用户的初始影响力分值,根据得分选取初始节点集合;最后,对影响力传播过程中的影响因子做出改进,通过贪心算法进行节点搜索计算获得被激活节点的最大化范围。实验结果表明,该方法能有效提高被激活节点影响范围,并更接近实际影响力传播情况。
其他文献
医疗保障制度作为一项保障公民健康权益的基本制度,是我国构建现代化社会保障体系的重要组成部分,背负着提高人民生活质量、维护国家稳定、促进社会和谐的重任。现有的全民医疗
<正>“校本培训”是教师专业发展的一个重要途径,由于它从本质上更注重了教育实践、更注重了教师的个体发展,所以,很快被学校教育管理者接受,成了推进学校二期课改,促进教师
本文通过重新审视联合国教科文组织发布的《教师信息通信技术能力标准》,探讨了信息通信技术在促进教师专业发展中的作用,归纳了此标准中三种教育改革取向对教师能力的要求,
孔子的思想,不像希腊思辨哲学那样来自于观念的辨析和推衍,而是来自于历史的经验。孔子的政治智慧在于,在精神层面要守经志道,建立"大同"的社会终极理想,这种理想既是追求,又
随着社会的发展,由多种原因引起的血小板减症越来越常见。血小板由骨髓中的巨核细胞产生,通过对巨核细胞增殖分化进行调控,可有效促进血小板生成。因此,具有升血小板作用的造血生
自次贷危机以来,国际上各大经济体深入地探讨了金融消费者保护制度改革这一议题,以加强国际合作和更广泛的金融消费者利益的保护。但是,由于几大经济体在核心观点上的冲突,金融消
<正>全国干部培训教材编审指导委员会组织编写本丛书是按中央组织主管部门统一部署而编写的全国干部学习培训教材,教材坚持以十八大精神为指导,重点阐述中国特色社会主义旗帜
随着时代的发展,媒体的概念不再局限于传统的报纸、杂志、广播、电视,以互联网、移动网络为代表的新媒体正逐步取代传统媒体的地位。新媒体的特点是开放性、及时性、互动性、共
目的探讨门诊量和门诊人均费用对门诊总收入的影响程度,同时还对影响每诊疗人次费用的多因素进行分析。方法利用综合指数方法,计算某医院2007年-2011年各指标项目的指数及对
风险管理是任何金融活动的中心。在实际活动中,数据又是风险管理体系中最重要的因素之一。本文通过数据在信用风险测算中的应用,特别是通过美国KDS公司的海量数据查询,计算的