基于微博的意见领袖挖掘算法研究

来源 :云南民族大学 | 被引量 : 1次 | 上传用户:lifengno1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,对于微博用户领域的意见领袖挖掘多以用户属性关系、网络传播以及文本信息交互这三个方面进行单领域的研究,但是三者没有真正得到有效的融合,缺乏结合微博文本情感的研究,同时研究多采用静态分析的方法。本文针对研究中存在的不足,从用户属性、微博信息传播规律及微博文本情感倾向角度出发,分别对意见领袖挖掘的相关问题进行了研究,并提出以下算法:第一,基于改进后的TFN-AHP的微博用户属性特征提取算法。该算法通过构造模糊精度矩阵和采用闭区间[0,1]的实数作为模糊判断矩阵标度值,避免了传统TFN-AHP算法中将某一属性特征权重武断判定为0的错误;同时使用可控迭代精度的迭代方法计算特征向量,使算法的时间复杂度从传统的4O(n)降低为2O(n),并基于该算法提取了微博用户属性特征向量。第二,基于微博信息传播的微博用户影响力分析算法。算法通过大量数据研究微博信息的传播规律,以微博被转发和被评论的累积数量为微博传播能力的衡量指标,以微博传播为用户影响力扩散的载体,建立了微博用户影响力随微博传播时间变化成指数截断性的幂律分布的算法模型,实现了对用户影响力的动态研究,并通过实验发现微博热度和微博用户属性值对用户影响力有决定作用。第三,基于词性标注序列模式匹配的微博情感倾向度算法(简称POSTSPM算法)。算法将微博文本看作由若干单词组成的有序词性序列组合,在对序列进行词性标注和化简的基础上,保留了决定情感倾向的词性序列,并结合HowNet情感分析词集,通过采用滑动窗口规则对词性标注序列依次进行模式匹配,最终得到整段微博文本的情感倾向度,且准确率较高。最后,考虑微博意见领袖的动态变化,结合上述三种算法提出了在特定话题下基于时间窗口的微博意见领袖挖掘算法,该算法将话题下微博持续讨论的时间周期划分成若干连续的子窗口,根据微博用户在每个子窗口内的影响力排名和微博文本情感倾向综合筛选出最终的意见领袖,所得结果较好,可以运用于微博意见领袖挖掘。
其他文献
采用高压水射流清洗机基础上,配套进给机构、旋转二维喷头及通水管路,实施深管小口径内部由高压高温作用产生的积碳和挂铜垢层。洗消效率高、无任何添加剂、保护生态环境。
符号模式矩阵是组合数学中一个十分重要的基础性问题,其研究和发展前景非常广泛。本文中,我们用幂零一雅可比方法证明了一个符号模式矩阵和一类符号模式矩阵是极小谱任意符号模
实验是化学的基础,随着新课改的深入,目前高中化学实验教学暴露出一些影响实验教学质量的问题,根据其教学现状和存在的问题,提出了改善之策.
本论文中所涉及的所有的图均为有限的、无向的简单图。在2012年,I.Gutman和S.Wagner提出了图的匹配能量(matching energy,简记为ME)这一概念,并追溯到20世纪70年代,指出了图的匹配
设计已非专业人士独占的有限领域,而是启发心灵的无形磁场;利用各种素材和工具,使设计者的创意更有型,做自己的设计师,这股风潮已经吹起,每一个设计扎扎实实都有自己的心血,
利用自适应控制对反馈线性系统在线逼近,基于对动态系统逼近认知来设计控制器已被证明是一个有效的方法。实际应用在飞机上的这类控制器稳定性,性能特点以及在控制冗余时卓越的
曲线曲面的光顺是计算机辅助几何设计研究中的重要课题,它具有重要的理论意义和实用价值。人们对曲线曲面的光顺进行了大量的研究,得到了一些比较有效的光顺算法。目前,曲线的光
本文分两部分.第一部分研究齐次Dirichlet边界条件下,具有梯度项平方增长的半线性抛物方程的双线性零能控性和相应的时间最优控制的存在性;第二部分研究齐次Neumann边界条件下
CT技术的快速发展使其在工业和医学领域得到了广泛应用。很多情况下,人们并不要求完整的物体图像,只要获得某些感兴趣区域的物体图像即可。本文针对锥束感兴趣区域CT图像重建
赵树理作为我国一位著名的文艺作家,创作了一大批深受人民喜爱的文艺作品,然而,“文革”十年浩劫,他也未幸免于难。在那黑白颠倒的年代里,赵树理以他深厚的学养、睿知的头脑