在线网络社区中舆论领袖识别模型的研究

来源 :中国集体经济 | 被引量 : 0次 | 上传用户:jijididixia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:目前,有许多理论被用来识别舆论领袖。一般使用节点的度数、紧密度、介数和不同领域的PageRank算法等中心化指标来识别出舆论领袖,这些方法虽然简单,但是由于它们仅利用了节点自身的外部属性,因而识别率并不高。为此,文章提出了一种舆论领袖识别模型IDMS。该模型不但考虑了节点的外部属性,而且还综合考虑了节点的内部属性,如文本内容的相关度。最后通过实验,验证了该模型可以更准确地识别出舆论领袖。
  关键词:网络社区;影响力发现;舆论领袖
  一、引言
  “舆论领袖”的概念是由美国哥伦比亚大学的传播学者Lazarsfeld、Berelson和Gaudet在1940年政治选举研究中提出的。舆论领袖会表达他们有影响力的评论或观点,提出指导意见,鼓励和指导大众去理解社会问题,因此舆论领袖的识别是非常重要而且是很有意义的。
  基于在线网络社区的网络交往特征,人际互动关系已成为国内外学者的研究热点,但是关于在线网络社区中参与者重要性方面的研究并不多见,特别是针对在线网络社区中舆论领袖的识别研究非常匮乏。社区参与者重要性评估、舆论领导者发现及其相关技术目前仍然处在起步阶段,为此本文针对在线网络社区中舆论领袖的识别问题进行研究。
  首先,本文研究的网络舆论领袖是指那些通过在新兴媒体发表帖子(文本)或者回复其他网络用户发表的帖子这种基于文本的交流方式。将自己的见解、观点传递给其他网络用户,引起他们内心的共鸣,进而影响、改变他们的观点、思想和决策的网络用户。
  其次,通过研究发现,很多的研究者在研究舆论领袖的识别方法方面存在一些不足:现有的研究工作侧重于分析网络用户间的外部联系,如发帖、回帖,忽略了内部联系,如帖子的内容。
  为此,本文提出了舆论领袖识别模型IDMS (Influence Diffusion Model Similarity),改进了影响力扩散模型IDM(In fluence Diffusion Model),增加了文本相似度的计算与分析。通过高频关键词识别出具有热点话题的帖子,然后再通过热帖识别出影响力大的网络用户,也就是从海量的具有回复关系的帖子中找出那些具有重要影响力的网络用户。只有影响力大的网络用户才是真正的舆论领袖。
  二、舆论领袖识别模型
  (一)基本思想
  假设C={C1,C2,…,Cn}是一个帖子的集合,同时Ci(1≤i≤n)是指任意的一个帖子,同时本文给出了以下的定义。
  定义1:外部联系和内部联系。对于任意的Ci和cj(1≤i,j≤n),假设Ci的发布时间早于Ci,如果Ci是Ci的回复,那么Cj和Ci就有外部联系。如果它们没有关系,但是ci和Cj之间有语义上的相似性(相同或不同)那么Cj和Ci之间就有内部联系。
  定义2:帖子网络。对于任意的帖子会形成两种网络,内部联系的网络和外部联系的网络。
  基于帖子内容和信息传播结构的影响力计算模型多是从词频角度着手。
  假设1:在BBS交流环境下。发帖和回复是BBS成员之间最直接的交互方式,人们通过发回帖来表达观点和意见,可以认为论坛对话链体现影响力的传递结构,即论坛成员通过交互关系传递影响力。
  假设2:论坛成员通过发帖表达观点和看法,帖子的基本组成单位是词语,可以认为论坛交流通过词语来表达和传播。
  通过挖掘蕴含在网络文本内容和回复结构中的规律来测量论坛参与者的活动,并假设论坛影响力最高的用户就是论坛舆论领袖。这里分为两种情况:一是在基于文本的论坛交流环境中,人们通过发帖、回帖表达自己的观点,因此论坛回复链体现影响力的传递结构:二是词语是组成帖子内容的基本单位,在基于文本的论坛交流环境中,交流通过词语来表达和传播。帖子影响力定义为帖子包含的词语集合在回复链传播的程度,采用回复关系的上下游帖子的词语交集数与下游帖子词语数之比来进行计算。帖子回复链结构表示了个体之间的关系,一个个体的影响力就是他提交的所有帖子的影响力的总和。因此,通过帖子的影响力计算就可以找到最有影响力的个体,也就是舆论领袖。
  (二)影响力计算
  帖子内容的主题相关性可以通过向量空间模型来计算。根据当前帖子和它回复帖子之间的主题相关度来分配影响力,计算的方法是对这些有回复链接关系的帖子的主题内容进行分析。
  具体过程如下:两个主题型帖子内容的相关性是根据两个帖子出现的相似关键词和高频关键词的次数总和进行计算的。计算帖子A和帖子B内容的主题相似度算法计算步骤如下。

其他文献
以“梦上海,我的上海印象”为主题的第七届(2015年)“上海轻工杯”上海特色旅游商品创意设计大赛2015年1月5日起开始举行。  本次大赛的内容为具有上海地域文化、特色、风情的旅游商品、旅游纪念(礼)品,以“英雄”品牌为商标的制笔文具用品,由上海市轻工业协会和上海轻工业工会联合会联合举办。上海市总工会为指导单位,上海市经济团体联合会(上海市工业经济联合会)为支持单位,上海英雄(集团)有限公司、老凤
0 引言 层次分析法(Analytic Hierarchy Process简称AHP法),它的主要特点是把复杂问题中的各种因素,通过划分为相互联系的有序层次而使之条理化,根据某一客观现实的判断就每
商业银行的信贷经营原则及目标要求信贷资金的流动与企业生命周期波动相吻合,即在企业成长阶段大力支持从而分享企业成长带来的利润,而在衰退阶段降低信贷数量甚至撤资从而降
1两个案例有两件事情足以使管理者警醒并破除对先进技术的盲目崇拜.一件是耗资50多亿美元建造了66颗低轨卫星系统的铱星公司于1999年8月向美国破产法院申请破产保护.2000年3
摘要:自扩招政策实施以来,我国高等教育事业得到了飞速发展,学校的办学规模进一步加大。教育经费、科研经费收支逐年增加,使得高校财务管理工作更加复杂和多元。财务报账是高校财务管理工作的重要环节,但由于财务管理制度不完善,报销方式和流程不尽合理等原因使得高校“报账难”现状日益突显,文章从高校“报销难”的现状入手,分析产生“报销难”现状的原因,最后提出解决“报销难”问题的对策。  关键词:高校;财务报账;
文章基于国际关系视角在国内相关研究的成果基础上,结合当前研究的热点问题,从网络主权与网络安全、网络安全与国际关系以及世界主要国家和地区网络安全战略导向三个层面对现
摘要:人力資源价值会计的核心内容之一是人力资源价值计量,其中货币性计量模型是主要的计量方法。文章通过对比当前理论界现有的货币性计量模型,在肯定完全价值法思想的基础上,引入工资增长率、剩余价值分配等理论对现存完全价值计量模型进行了改进,以增强其在实践中的可操作性。  关键词:人力资源价值;货币性计量模型;完全价值法