基于微博平台的新兴热点话题检测研究

被引量 : 0次 | 上传用户:lm403379799
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博,一个基于用户社交关系为用户提供信息获取、分享以及传播服务的新型社交网络平台,是随着互联网技术的发展,以及用户的实际需求应运而生的。目前,基于微博平台数据的信息挖掘,商务产品的微博营销,公众舆论情感挖掘等研究层出不穷,旨在通过利用微博平台上的海量数据挖掘有价值的信息,实现政法部门的社会监管,实现企业产品的市场推广,实现智慧城市的发展。本文的主要研究内容是基于微博用户和文本数据挖掘出指定时间段内的新兴热点话题。主要流程如下:首先,借鉴Page Rank算法基本思想基于用户关注关系网络计算用户权威值;然后,基于关键词建立生命周期模型,并通过用户的权威值和关键词的权重计算关键词的营养值,再引入时间框架将营养值转化为能量值,挖掘出新兴热点关键词;最后,利用关键词之间的语义关系构建话题图,并以新兴热点关键词为语义中心利用图的遍历算法找出一组与之语义相关的关键词作为话题集,计算话题的能量值挖掘出新兴热点话题。本文的最后一部分使用真实的微博数据进行实验,验证算法的有效性。本文的主要贡献有:1.提出了一种基于关键词的能量值计算方法和基于PageRank思想的用户权威值计算方法。本文将话题细化为一组语义相关的关键词,生命周期建模、营养值和能量值的计算都是以关键词为单位,并且在计算中引入了用户权威值这个影响因素。2.提出了一种基于用户的TF*PDF关键词权重的计算方法。根据微博的发布用户将其分组,还将关键词的权重分为相对权重和绝对权重,体现了不同用户对同一个关键词的不同影响。3.构建了一个基于关键词的语义关联结构图,并利用图的强连通结构和遍历算法找出了一组与特定新兴热点关键词语义相关的话题词集,还提出了一种计算话题能量值的新方法。
其他文献
阐述海军C~3I的雷达对抗、通信对抗、水声对抗、光电对抗的开发水平及其发展趋势。 随着海军及舰载C~3I系统技术的不断提高,与之相应的电子对抗也得到了迅速发展。为此敌我双
图像分割是将图像划分成若干具有意义的子区域的技术。例如,一副航空照片可以划分为居民区、森林和湖泊等具体区域。近年来,追求智能化的彩色图像图像分割成为图像分割领域的
任务型语言教学自20世纪80年代开始兴起,已经走过了近三十年的历程。作为交际法的一个延伸发展,任务型语言教学倡导以学习者为中心,通过为学习者设定一系列任务来帮助学习者
目的:探讨耳颞部高分辨螺旋CT扫描以及三维重建成像(SSD)的临床应用价值。方法:对49例正常、79例耳部病变患者,采用高分辨螺旋CT扫描。层厚1mm,小视野FOV:5cm,矩阵512×512,
<正>新闻媒体监督权与司法独立审判权的界限一直是新闻界、法律界一个有争议的问题。近几年来,随着新闻媒体的舆论监督对我国社会的影响越来越大,如何处理好新闻媒体监督权与
采用有限元法对某在建互通立交匝道的小半径、宽桥面钢筋混凝土曲线现浇连续箱梁桥,在非重力荷载作用下的内力及墩梁相对变形进行分析。得出该类桥型在非重力荷载作用下的内
按照疾病的认知规律,传染病的健康教育教案撰写纲要为:病名、概述、流行环节、治疗原则、防制措施;非传染病的健康教育教案撰写纲要为:病名、概述、危险因素、救治原则、防制措
随着新课程改革的施行,各种新型教学模式的兴起给教育带了来全新的风气。在西医诊断学的教学中,翻转课堂联合模拟教学的运用能极大程度地提高学生学习兴趣,增强学习的实践性,
C/S(客户机-服务器)模式软件存在客户端资源消耗大、部署繁杂、升级困难等问题。论文设计了一种基于Java平台的B/S(浏览器-服务器)架构态势原型系统,解决了体系结构、信息规
目的 观察大鼠局部脑缺血再灌注脑组织的病理改变特点。方法 建立鼠脑缺血再灌注模型 ,采用HE染色 ,观察缺血部位、组织学改变、神经功能缺损。采用TUNEL法检测神经元凋亡