主题标签流行度预测方法与应用技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:neverdrop920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着技术的不断发展,互联网上涌现出了许多社交媒体,比如微博,Twitter等社交网站,越来越多的人参与其中,获取实时的在线信息。微博作为一个大众的社交工具,人们在上面不断发布消息,获取热门话题。微博上的主题标签作为一个用户自发打下的标签,表达了用户真实想法,对于捕捉用户兴趣和关注有极大作用。但是目前对于主题标签流行度预测的研究还是比较少,大部分都是基于微博消息的研究,同时主题标签的流行度反映了当下的社会群体的关注点,表述了网民对于事件的关注程度,本文从微博的实际场景出发,根据主题标签的自身特性进行相关研究,构建主题标签的流行度预测模型,关注其未来趋势,对于发现热门话题十分重要。  一方面,现有基于特征的主题标签流行度预测算法没有考虑用户粉丝之间的网络结构信息以及主题标签自身的特性。鉴于此,本文对用户网络结构信息和主题标签的情感性,地域性等信息进行特征分析,提出了一种考虑用户粉丝网络结构特征以及主题标签自身特性的流行度预测模型。实验证明,新提出的特征是有效的,对以后主题标签的流行度预测具有较高的参考价值。  另一方面,传统的消息预测模型是单源问题,每一个消息都是由一个个体发出然后进行转发传播。但是相同的主题标签可以由不同的个体从不同的时刻发出,为了处理多源主题标签流行度预测问题,本文提出了一种基于微观角度的主题标签流行度预测算法,首先构建每个源头的主题标签传播机制,然后使用注意力机制刻画每个源头的重要性,从而得到全局的表达。实验证明该模型的有效性,同时为以后多源问题的解决提供了思路。  最后,依据基于特征的主题标签流行度预测算法,本文设计并实现了一个事件热度预测系统,包含微博数据采集、任务下发和事件流行度预测等模块。该系统能够自动发现事件,尤其是可以根据事件的流行度来评估网民关注的话题,在网络舆情分析等领域具有较高的应用价值。
其他文献
近十几年来,随着数字图像获取设备的日益方便,计算机存储介质成本的不断降低,互联网络技术迅速发展,同时随着人们对可视媒体的日益兴趣和关注,互联网上数字图像的数量和种类正在以
三维地质建模在上世纪90年代初期开始为人们所重视,并逐渐成为计算机图形学、油气藏勘探、科学计算可视化及GIS等领域的研究和应用热点。三维地质建模包括两类模型的构造:三维
调度是决策的一种形式,它在制造业和服务业中扮演着关键角色。生产调度是实现制造业运筹、管理与优化技术的核心,它是在时间上对一组可用的制造资源进行加工任务的安排,将工
本文主要研究的是地理信息系统中图形数据传输技术。随着Internet技术的不断发展和人们对GIS需求的日益增加,GIS同网络结合在了一起,形成了WebGIS。GIS中的数据量非常大,特别是
BPMN流程建模工具是一个能够为业务系统设计符合特定建模准则的可视化、可执行的流程设计建模的工具。本文从技术背景、需求分析、功能设计、系统实现、测评与持续开发的角度
在科学研究和工程应用中,稀有类的数据样本往往具有重要的研究价值。例如,在网络访问数据集中,绝大部分的数据样本是正常的网络访问,小部分的数据样本是网络入侵行为,而只占小部分
随着计算机技术的发展与经济全球化时代的到来,越来越多的组织和企业采用工作流技术以提高竞争力和应对突发事件的能力。作为创建、执行和管理工作流的系统软件,工作流管理系统
随着仿人机器人硬件水平的不断提高,仿人机器人的研究领域不断被拓宽和深入,已经成为了机器人学研究中最受瞩目的课题之一。其中,双足机器人直立行走的步态规划是仿人机器人
为了确保老人的健康和安全,养老机构的设计和运行需要考虑老年人的热舒适性。尽管对热舒适性的评价方段很多,但还没有标准化的方法来评估和监测养老机构中老年人的热舒适性。这
随着移动通信技术的快速发展,用户要求的进一步提高,国内移动网络运营商也在加紧3G网络的部署和运作。为了保证第三代移动通信系统中核心网(CN)的安全,防止外部Internet网络