同质性和社会影响对混合型社交网络形成的仿真分析

来源 :现代情报 | 被引量 : 0次 | 上传用户:jbajba321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  〔摘要〕在线社交网络已经成为人们网络生活的最主要平台,网络也逐渐从单一的社会网络向混合型网络转变,形成了社会网络和参与活动形成的归属网络两类网络相互交织和促进的现象。识别社会影响和同质性两类机制在这类网络形成中的作用大小和特征,对促进在线社交网络健康发展和采取不同的营销策略意义重大。本文先对百度贴吧、派代网作实证分析,分析不同机制下网络呈现的结构特征,然后使用扩展的社会归属网络模型对混合型在线社交网络进行仿真,分析社会影响和同质性两种机制对混合型在线社交网络形成的影响。
  〔关键词〕混合型社交网络;同质性;社会影响;仿真分析
  DOI:10.3969/j.issn.1008-0821.2017.04.013
  〔中图分类号〕G203〔文献标识码〕A〔文章编号〕1008-0821(2017)04-0087-08
  The Simulation Analysis of Homophily and Social Influence on the
  Formation of Hybrid Online Social NetworksHe Jun1,2Liu Yezheng1
  (1.School of Management,Hefei University of Technology,Hefei 230009,China;
  2.School of Business,Anhui University,Hefei 230601,China)
  〔Abstract〕Online social networks have become the main platform for people.The social network has gradually changed from a single network to a hybrid network,one is social network and another network formation from participation in activities.The two types of networks Interweave and promote each other.It is valuable for promote the healthy development of online social networks and adopt different marketing strategies,to identify the role and characteristics of the two mechanisms about social influence and homogeneity.Firstly,the paper made an empirical analysis on the Baidu PostBar and Paidai BBS,analyzing the structural characteristics of their networks under different mechanisms.Then,it used the extended affiliation Networks model to simulate the hybrid online social network.The paper analysed the impact of two mechanisms on the formation of hybrid online social networks.
  〔Key words〕hybrid online social networks;homophily;social influence;simulation analysis
  在线社交网络已经成为人们网络交流活动主要平台,络内成员间交互频繁,共同参与社区活动。当前在线社交网络越来越向混合型网络(Hybrid Network)演化[1],例如在社交網站中植入商务信息,如蘑菇街、大众点评网;而传统的电子商务也开始向社会化商务迈进,在交易平台中植入社交功能,如支付宝新年集五福活动。这类混合型在线社交网络大体上包含两类主要社会关系,一类是用户之间交互形成的社会网络,如关注关系、帖子回复关系,一类是群体参与社区活动形成的归属网络(Affiliation Networks)[2-3],用户间的交互关系会影响用户参与社区活动,而参与社区活动也会使没有联系的用户间建立起联系。社交网络中用户关系形成的社会网络和各类活动形成的归属网络互相交织与促进,针对这类混合型在线社交网络探讨其网络社群中个体的行为模式,个体是基于何种因素选择加入一个群体,如何参与社区活动,个体行为受群体的影响如何,对于维护这类网络的稳定和发展意义重大。
  以往研究表明网络的形成机制,个体间建立连接因其依赖的特征类型不同可大体分为同质性(Homophily)、社会影响(Social Influence)和群体外部环境因素(Exogenous Effect)的影响。人们倾向于和他们相似的人之间形成友谊关系,称为同质机制,即人们根据相似的特征选择朋友,同质性的作用在社会学中的研究普遍受到Lazarsfeld和Merton研究的影响[4]。同时,人们会因为需要和其他人保持一致而改变自己的行为,这个过程被描述为社会影响,Friedkin对社会影响做了系统研究[5]。Denise等人用同质性和社会影响对美国青少年的友谊做了实证分析[6],2005年后应用两个机制研究网络群体越来越多。人们在社交网络中参与他们感兴趣的社区活动,主动寻找与他们行为相似的人,但他们也会因群体的影响而迫使自己改变行为,以便更适应他们的社交圈,在此过程中,两种效应同时影响用户的行为。而这两种效应之间的冲突,将影响到社交网络的营销策略,当社区中存在着诸如购物、电影、旅游等共同兴趣时,若观察到的共同兴趣完全是因为社会影响形成的,就可以考虑瞄准一个特定人群如具有一定影响力的子群实施营销,此方案将会对整个社区产生广泛的影响;但若共同兴趣完全是因为同质机制产生的,那么上述方案只能对所瞄准的特定人群起作用,而对其他人群就难以产生效果,企业的营销方案设计就要考虑社区中绝大多数人的兴趣偏好。因此理解这两种机制之间的差异不仅有利于揭示社交网络及用户行为形成的原因,也有利于发现在网络中实施某种干预的效果[7]。   在研究方法上,李倩倩等提出一个在线社交网络生成模型,采用优先连接刻画网络无标度特性,从微博好友推荐机制建模节点趋同性,考虑了社交网络形成的同质性和聚类性等因素[8]。本文也用仿真的方法进行研究,仿真使用扩展的社会归属网络模型。社会归属网络可用来研究个体参与活动的模式,网络存在两类节点,一类节点表示个体,一类节点表示活动,边表示节点间的社会关系或表示节点与活动间的参与关系[9]。一旦有了社会归属网络,则节点间连接的形成可看成某种形式的闭包过程[10],包括三元闭包,即两个个体B、C都有共同的邻居个体A,则B、C间的边的形成属于三元闭包(Triangles Closure);社团闭包(Community Closure),两个个体B、C都有共同的活动A,则B、C间的边的形成属于社团闭包,参与共同的活动是同质性的结果;会员闭包(Membership Closure),个体B与个体A相邻,且个体A参与了活动C,则B、C间的边的形成属于会员闭包,B参与A已经参加的活动是社会影响的结果。因此,通过对社会归属网络中闭包过程的仿真分析,能为分析混合型在线社交网络的形成机制提供依据。
  1国内外研究现状
  社会影响和同质性是影响个体行为的两个重要因素。首先,社会影响是人类决策受到与他人社会交往的影响,描述与他人的交往过程对决策的影响。人们考虑别人的意见,以避免和大多数人偏差太大[11];针对美国国会选举在Facebook上进行6 100万人随机试验,发现社会影响能够明显改变个体的行为[12];Muchnik同样通过大规模的随机试验证明了社会影响能够改变个体决策[13]。其次是同质性现象,即具有相似特征的人有可能建立关系。McPherson对同质性做了深入的研究,如果人们具有相似的特征,就会表现出相似的行为而建立联系[14];Leskovec分析具有时态信息的4个大型社交网络,证明了同质性的存在[15];Lewis通过收集一群大学生在Facebook上4年的活动数据,发现在电影、音乐方面具有相同兴趣爱好的人容易结成好友[16]。
  对两种机制所形成网络差异的研究也很多。Dholakia实证表明同质性形成的群很多是线上线下关系的结合,而参与社会影响的群是为了某个特定的目的[17]。Backstrom对网络三元闭包分析,闭包是社会影响和同质性共同起作用[10]。Aral研究指出在传播初期同质性可能更加重要[18]。Yu Rong基于CMPP模型,对豆瓣的研究表明,人们对新电影更可能受社会关系影响,而旧电影很大程度上由其内在特征引起[19]。国内肖邦明对交易型社区的仿真表明基于同质性的传播在初期有较快的扩散速度,而基于社会影响的扩散可以达到更大的范围[20],并提出基于社会影响、同质性的交易型社区的病毒式营销策略[21]。
  以上研究表明,真实网络的实证研究证实网络社群的产生是由同质性、社会影响和一些外部环境因素共同作用的结果。总的来说,要明确区分两种影响因素较为困难,在混合型在线社交网络存在大量社区活动的情况下,如果能了解同质性和社会影响机制在网络形成中的作用,将能更好地引导社交网络的发展和指导社会化营销工作。
  2混合型在线社交网络实证分析
  本文使用百度贴吧和派代网真实数据集对混合型在线社交网络特征进行比较。百度贴吧把对同一个话题感兴趣的人聚集在一起,方便地展开讨论和互相帮助,用户通过参与话题讨论形成社会关系。实验选取的贴吧于2009年2月建立,共采集2014年8月至2015年4月共0.71万个话题主题,28.6万个帖子。本文选取参与15个以上话题讨论的活跃用户4 174名和1 420个参与讨论用户数在30个以上的话题作为实验数据集。派代网是目前国内最具影响力、交流最活跃的电子商务行业深度交流平台,用户也是通过对感兴趣的话题讨论形成社会关系。实验的主题论坛共采集2006年12月至2015年12月,20个以上用户参与讨论的话题1 782个,8.2万篇帖子,至少参与3个以上话题讨论的用户4 869名作为实验数据集。
  两个实验数据集用户的用户关注关系网络宏观指标如表1所示,两个数据集指标较为接近分析不出同质性和社会影响机制的作用大小。但是贴吧的互惠边数量远远多于派代网论坛,显示贴吧用户间的相互交流较多。再进一步分析节点的入度分布,如图1、图2所示,右边派代网节点的入度曲线更加陡峭,存在一个非常高的节点,而大部分节点的入度值都很低;贴吧的入度曲线相对平缓一些,节点的入度值分布较为均匀。网络结构图3和图4差异更加明显,可以看出派代网节点都围绕在中心节点周围,存在明显的核心边缘结构。从参与活动的图5、图6分布来看,两者区别不大,分布图显示的不是典型的幂律形式,因为已经剔除参与人数较少的社区活动,所以呈现泊松分布的特征,因为新加入的社区活动还有很多用户没有参与。从结构特征来看两者存在较大的差异,贴吧属于同质性作用大的网络社区,而派代网是典型的社会影响作用大的社区,这也与我们对这两个社区的认识相同。贴吧是共同兴趣偏好的人聚集在一起,彼此地位差距不大,而派代网的用户很多是为了获取信息,那些电子商务领军企业的创始人和资深行业专家,显然会吸引大量的用户关注,影响力大大高于一般用户。
  3混合型社交网络仿真分析
  混合型在线社交网络用社会归属网络可表示为N={U,V,E1,E2,W,R,P},其中U、V是分别表示用户和活动两类节点;E1表示用户之间关系的边集合,E2表示用户与活动之间关系的边集合;W、R、P是3类标签的集合,分别表示用户的权重、用户间关系的强度以及用户参
  与某项活动的概率。用户的权重W体现了该节点在社交网络中的影响力,关系强度R体现了用户间联系的紧密程度,概率分布P体现了用户对社区活动的兴趣程度。社会归属网络随时间演化发展,新的朋友关系建立,个体也参与新的社会活动,这种演化反映了社会影响和同质性之间的相互作用,如果两个用户参与了同一个社会活动,那么这为他们成为朋友提供了機会,如果两个人是朋友,那么他们之间会影响对方参与新的社区活动。   仿真在初始网络的基础上通过新节点、新活动产生,社区间老节点产生新连接、参与新活动,来模拟网络的形成和演化。文献[22]分别计算同质性和社会影响的作用机制,同质性改变图的结构,社会影响改变节点属性。本文也假设节点间建立连接和参与社区活动是两个关联过程,设每轮有新节点和老节点根据社会影响和同质性连接加入网络和更新,假设若是受社会影响作用,则优先连接高影响力的节点,再受有连接关系节点影响,选择加入社区活动;若受同质性作用,则先选择参与感兴趣的社区活动,再根据参与社区活动情况选择连接兴趣相似的老节点。
  3.1初始设置
  设定网络初始状态有m0个初始节点任意连接形成有向图G,图G节点集合V0={v1,v2,…,vm0},节点间边集合E0={e1,e2,…,en0}。在社交网络中,一般用户使用标签,明确表明自己的兴趣爱好,或者也可以从用户发表的内容,如文本中获取用户的兴趣爱好,与LDA模型类似,设此社交网络中有I=100种兴趣主题,随机给节点分配兴趣,节点的兴趣属性包含兴趣主题数量服从正态分布,则每个节点的兴趣向量Ii=(i1,i2,…,i100)。社区中的活动也包含一定的兴趣主题,Ia=(i1,i2,…,i100),活动包含的兴趣主题数一般小于用户的兴趣数。
  3.2网络演化
  Step1:新节点加入网络
  1)新节点连接老节点
  每轮新加入m1个新节点和各自n1条新边,新节点加入是基于受到社区已有节点的影响或对社区活动的兴趣度,节点随机选择是由于社会影响还是同质性加入社区,实验将对随机选择的概率参数infsim做多次的仿真分析。Flag=1表示是基于社会影响,根据择优机制先连接老节点,Pi=ki∑jkj为与老节点i连接概率,其中ki为老节点入度数,再根据受到老节点的影响而参与社区活动;Flag=0表示是基于同质性,节点基于兴趣参与社区活动,再根据参与社区活动情况连接,和具有共同兴趣偏好的节点i连接,节点连接概率Pi=ti∑jtj,tj为共同参与社区活动数。根据社团闭包,i和j共同参与的社区活動越多,其兴趣越相似。新节点以轮盘赌方式加入社区P(pi)=pi∑Nj=1pj。同时不刻意剔除重复连接情况,也就是存在某个新节点每次都连接到同一个高影响力节点和参与兴趣匹配高的同一活动情况。
  2)新节点参与社区活动
  每轮新节点参与a1个社区活动,Flag=1基于社会影响时,节点受到连接对象影响,选择加入社区活动i,Pai=ai∑jaj,ai为已连接节点参加某活动的节点数。根据会员闭包i参与了某活动,会影响j参与此活动。Flag=0基于同质性时,Pai=si∑jsj,si为节点兴趣向量与活动i兴趣向量的Jaccard相似度,节点以轮盘赌方式选择参与相似度高的社区活动。
  Step2:社区产生新活动
  新社区活动的吸引力因子ActF,仿真社区中活动的可能流行程度。在ActF和活动产生时间ActT基础上,计算社区活动的热度ActH,热度高的活动会吸引大量节点参与。活动会随着参与节点数的增多而提高热度,同时活动热度也会随着时间不断进行衰减。ActH(i)=(Actsum(i)ActF(i))/((k-ActT(i)) 2)^1.5,为社区活动i热度计算公式,参考Hacker News的热门排名算法,k为当前时间,Actsum(i)为参与社区活动i节点数,ActT(i)为社区活动i产生时间,1.5为比重参数。节点选择加入活动时,社区活动根据热度进行排序,每轮社区中只有参数ActHot个热门社区活动会处于激活状态,不热门活动会慢慢从社区中消失。
  Step3:社区老节点更新
  每轮有m2老节点根据社会影响和同质性连接n2个新的节点和参与a2新的社区活动。同理,老节点新增连边在社会影响机制下,连接高影响力节点,然后根据节点影响参与社区活动;在同质性机制下,根据兴趣参与新的社区活动,再根据共同参与社区活动数连接新节点。
  Step4:更新社区节点的连接矩阵A和参与社区活动矩阵Act。
  3.3仿真说明
  1)仿真不考虑活动的发起人,同时假设节点基于社会影响和同质性的动机在网络演化过程中没有改变。
  2)社区活动的兴趣主题如果与大多数成员的兴趣偏好接近,就有可能成为热门活动从而吸引大量用户参加,同时一些外部环境影响也会突发产生热门活动,为此为每个活动设置吸引力因子ActF模拟此种情形,活动的ActF服从度值alpha为2.5的幂律分布。社区活动的热度ActH与ActF和活动产生时间ActT有关,新产生的活动将具有较高的热度,同时热度会随着时间演化衰减,随着参与节点数的增多提高。
  3)网络中已经存在节点也会参与社区活动,同时节点间也会产生新的连接关系,但节点的兴趣偏好在网络演化过程中不改变。
  4)活动产生与节点数量的关系,根据实证分析,拟合社区节点数与社区活动的关系,首先对每天新增结点数的变化进行拟合,f(x)=ax-t,x、t可以根据实验社区进行确定,则N=f(x) b,N为社区活动,仿真社区活动和节点数的关系,本文根据实证分析,1 000个节点的社区在数据采集期间,去除参与较少的话题,大概产生200个话题活动。
  3.4仿真结果分析
  仿真参数设置节点总数为1 000,节点超过1 000一般会分裂为多个更小的社区,200个社区活动,初始节点m0=10,节点间随机连接,随机以社会影响或同质性,参与初始有Act0=5个社区活动。每轮产生m1=1个新节点和各自n1=3条新边,每个新节点参与a1=3个社区活动,每轮更新m2=1个老节点和各自n2=3条新边,每个老节点再参与a2=3个社区活动。社区的活动随机产生,但每轮社区有ActHot=20个热门活动供用户参与。infsim表示网络节点受社会影响还是同质性的概率,infsim=0表示所有节点参与动机为社会影响机制,infsim=1表示所有节点参与动机为同质性机制。具体到某个节点,Flag=1表示参与动机为社会影响,Flag=0为同质性。   [5]Friedkin N E.A Structural Theory of Social Influence[M].Cambridge University Press,1998.
  [6]Kandel D B.Homophily,selection,and socialization in adolescent friendships[J].American journal of Sociology,1978:427-436.
  [7]Ma L,Krishnan R,Montgomery A L.Latent homophily or social influence?An empirical analysis of purchase within a social network[J].Management Science,2014,61(2):454-473.
  [8]李倩倩,顾基发.用户行为驱动的在线社交网络建模[J].系统工程学报,2015,(1):9-15.
  [9]Wasserman S,Faust K.Social network analysis:Methods and applications[M].Cambridge university press,1994.
  [10]Backstrom L,Huttenlocher D,Kleinberg J,et al.Group formation in large social networks:membership,growth,and evolution[C]∥Proceedings of the 12th ACM SIGKDD international conference on Knowledge discovery and data mining.ACM,2006:44-54.
  [11]Denrell J.SOCIOLOGY:Indirect social influence[J].Science,2008,321(5885):47-48.
  [12]Bond R M,Fariss C J,Jones J J,et al.A 61-million-person experiment in social influence and political mobilization[J].Nature,2012,489(7415):295-298.
  [13]Muchnik L,Aral S,Taylor S J.Social influence bias:A randomized experiment[J].Science,2013,341(6146):647-651.
  [14]McPherson M,Smith-Lovin L,Cook J M.Birds of a feather:Homophily in social networks[J].Annual review of sociology,2001:415-444.
  [15]Leskovec J,Backstrom L,Kumar R,et al.Microscopic evolution of social networks[C]∥Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining.ACM,2008:462-470.
  [16]Lewis K,Gonzalez M,Kaufman J.Social selection and peer influence in an online social network[J].Proceedings of the National Academy of Sciences,2012,109(1):68-72.
  [17]Dholakia U M,Bagozzi R P,Pearo L K.A social influence model of consumer participation in network-and small-group-based virtual communities[J].International journal of research in marketing,2004,21(3):241-263.
  [18]Aral S,Muchnik L,Sundararajan A.Distinguishing influence-based contagion from homophily-driven diffusion in dynamic networks[J].Proceedings of the National Academy of Sciences,2009,106(51):21544-21549.
  [19]Rong Y,Cheng H,Mo Z.Why it happened:Identifying and modeling the reasons of the happening of social events[C]∥Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.ACM,2015:1015-1024.
  [20]黃敏学,肖邦明,孙培翔.基于网络闭包理论的交易型社区网络演化研究[J].系统工程理论与实践,2015,35(5):1165-1176.
  [21]肖邦明,黄敏学.交易型社区的病毒式营销策略:基于社会影响、同质性和网络拓扑结构的ABMS仿真研究[J].营销科学学报,2015,(1):22-38.
  [22]La Fond T,Neville J.Randomization tests for distinguishing social influence and homophily effects[C]∥Proceedings of the 19th international conference on World wide web.ACM,2010:601-610.
  [23]Guo Z,Li Z,Tu H.Sina microblog:an information-driven online social network[C]∥Cyberworlds(CW),2011 International Conference on.IEEE,2011:160-167.
其他文献
我国少数民族传统体育文化源远流长,各种形式的体育活动是民族传统体育旅游的重要资源,这些得天独厚的少数民族体育旅游资源,为其开发利用奠定了坚实的物质基础。
理论研究表明,存款保险定价机制导致商业银行风险转移和道德风险问题,传统资本和资产监管旨在解决风险转移问题,却导致了低效率问题。管理层的激励参数可以作为存款定价的参
随着我国对外贸易经济发展步伐的加快,市场对高职高专商务英语专业人才需求不断扩大。本文以云南省高职高专商务英语专业现状为例提出了改革模式。
本文系河北省哲学社会科学规划研究项目(项目编号:200605020)和河北省科学技术研究与发展计划项目(项目编号:044572134)系列成果之一    资源的有限性和有价性使得其如何合理配置成为一个重要的研究领域,和其他资源一样,信息资源也存在配置问题。通过信息资源的合理配置,使用户便捷又准确地获取所需要的信息资源,最大限度地发挥信息资源的作用,从而实现信息资源配置的最优化。信息资源配置只有与用
〔摘要〕随着我国金融市场和网络技术的发展,财经垂直门户成为了财经信息服务的主体。在分析我国财经垂直门户特点的基础上,借助信息生态理论,提出了一种自上而下构建财经垂直门户服务质量层次本体评价模型的方法,并且结合层次分析法设计了相应的服务质量评价软件,将抽象的服务质量评价模型具体化为定量的指数排序。运用评价软件对我国5个具有代表性的财经垂直门户进行了评价,并对结果进行了讨论。  〔关键词〕财经垂直门户
<正> &#39;四川长虹&#39;是我国股市中的老牌绩优权重股;&#39;长虹&#39;家电,在我国市场上颇受消费者青睐;而长虹的当家人倪润峰,在我国企业家行列里亦可谓独领风骚。然而,打
〔摘要〕[目的/意义]共享平台是共享经济下图书馆服务模式转变的主要驱动力,能够促进图书馆服务向多元化、精准化、共享化的模式转变。[方法/过程]本文将共享经济模式与共享平台相结合,对共享型图书馆服务模式展开了研究工作,结合电子商务企业及互联网平台的成功案例,对共享型图书馆服务模式中共享平台的概念与内涵、共享平台的核心要素、共享平台的服务策略、共享平台的个性化推荐等方面进行了详细的阐述。[结果/结论]
[摘 要] 在研究数据仓库技术的基础上,将“数据仓库”理论运用于我国发展中的连锁超市的决策管理,提出了连锁超市数据集市的数据模型——雪花模型。并对数据模型中的事实表、维度表、大维度、粒度、聚集事实表等相关的技术问题,进行了细致的探讨。对研究并建立连锁超市数据仓库具有参考价值和实际意义。  [关键词] 连锁超市 数据仓库 数据集市 雪花模型 基础事实表 维表 聚集事实表    随着市场经济的发展和人
收益管理是航空公司提高收入、参与市场竞争不可或缺的手段,但是目前传统的收益管理并没有给航空公司带来预期收益。本文针对航空收益管理发展中存在的问题进行了探讨,并提出
<正> 内容简介: 人是动物,我们有时很口怕,有时很伟人,但总是动物。我们也许一厢情愿地自以为是堕落红尘的天使,但实际上我们只是站直了身子的猴子。我