基于事件检测的微博社交网络社区识别方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:focus2316a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区识别是社交网络分析领域的重要研究内容,近年来得到了各领域研究者的广泛关注。社区是网络中的密集群组,满足同一社区内部节点间的链接相对紧密,不同社区节点间的链接相对稀疏。由于社区结构的这一特性,社区识别被广泛应用于舆情分析、蠕虫控制、商品推荐等应用系统。微博是典型的社交网络,随着移动互联网的快速发展,微博已经融入到人们的日常工作和生活当中,成为舆情产生和传播的重要场所。和传统的社交网络社区识别不同,在微博中人们会针对不同的事件,以简短、便捷的方式发表自己的观点与见解,因此如果单纯的以网络的结构特征作为社区识别的优化目标,而忽略用户对特定主题的情感倾向性,会导致生成的社区结构稳定性较差,增加了社区碎片化的可能性。为了解决这一问题,提出一种基于事件检测的微博社交网络社区挖掘框架(Event-based Community Miner,ECM),认为理想的社区结构内部成员应当对特定的社会事件持有相近的情感倾向,具体研究内容包括:1.微博事件提取。本部分研究利用滑动窗口跟踪微博文本流入,用KMedoids算法将微博帖子聚类为事件集,根据事件集中帖子的转发数、评论数以及粉丝数计算出事件的影响力,提取出热点事件。2.情感倾向性分析。本部分研究构建微博的情感词词典、表情词典、否定词词典、程度副词词典,对词典中没有的元素进行扩充,制定句子级极性评价规则,计算用户评论的情感极性。3.情感社区识别。本部分研究以用户对热点事件的极性指标为用户的情感标签,利用用户之间的最大互信息系数,修改标签传播算法的标签传递、更新以及终止规则,识别情感社区。在仿真实验中,分别验证经典社区识别算法、语义社区识别算法以及ECM算法在社区个数、社区尺寸、拓展模块度以及语义模块度等指标上的结果差异。仿真结果表明,与传统的社区识别算法相比,ECM算法考虑了微博用户对社交事件的情感倾向,使得社区结构具有较高的内聚性。
其他文献
国际煤炭业发展势头迅猛,国际煤业巨头不断提高利用全球资源的能力,进一步加强产业和市场集中度,布局全球,强化资本多元化发展。在此背景下,中国煤炭企业在加快国内煤炭资源
遥感高光谱图像因其丰富的光谱信息而被广泛用于精准农业、军事目标识别、地物勘测等领域,然而由于成像传感器物理条件的限制,遥感高光谱图像的空间分辨率较低,制约了高光谱
背景:实体肿瘤通过新生血管为其生长提供营养和转移途径,遏制血管形成可抑制肿瘤生长。新生血管形成在实体瘤及多种疾病中起关键作用,是药物治疗的良好靶点。新型的脊椎类模
图像超分辨率重建技术(Super-Resolution,SR)指的是将给定的低分辨率图像通过特定的算法恢复成相应的高分辨率图像。高分辨率图像可以提供更多的细节,这些细节往往在应用中起
研究背景和目的蛋白质相互作用对肿瘤细胞的生物学行为过程具有非常重要的作用。PFKFB3是调节细胞糖酵解过程的一个关键酶,已经成为靶向肿瘤能量代谢研究的一个重要靶点。CDK
我国幅员辽阔,农业发展迅速。紫花苜蓿营养丰富,对环境的适应能力较强,是牧草之王。伴随着农耕方式的转变,除草剂在农业生产上得到广泛的推广和使用,为降低除草剂对紫花苜蓿生长的影响,对紫花苜蓿进行品种改良是关键。虽然常规育种方法有可能提高紫花苜蓿的抗性,但可种植面积变少,品种选育时间较长,因此我们力求寻求出一种高效、便捷的方法—抗除草剂转基因紫花苜蓿与雄性不育系杂交法。以紫花苜蓿雄性不育系作为母本,可大
由于核磁共振对软组织有较佳的清晰度,采用MRI图像引导的乳腺介入手术因其微创性和准确性而备受关注,但是MRI具有其独特性,如内部空间有限,材料选择需使用核磁兼容的材料等,
大数据云计算在推动各行各业快速发展的同时,也给个人隐私安全带来了严峻挑战。为了能够更好地推动各行业的快速发展,越来越多数据需要被共享,这些数据中包含了一些较为敏感
从2003年Belle合作组发现X(3872)以来,一系列的类粲偶素态(XYZ态)被BaBar、Belle、CLEO和BESⅢ合作组在e+e-碰撞中观察到。如:Belle合作组在B±→K±π+π-J/ψ衰变中观测到X
森林在生态系统中起着关键作用,是陆地生态系统的主题,森林具有多种强大的功能,不但可以实现大气的净化,确保空气保持稳定的平衡,而且还能为人类的生存与发展提供生活的基本