基于微博中情报领域异常人际关系模型算法研究

来源 :决策与信息·中旬刊 | 被引量 : 0次 | 上传用户:luijia2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:微博作为目前最流行的网络社交平台之一,为人们的人际交流开辟了新的途径。文章基于微博中的转发、评论、关注等具体交流行为,发掘其内在的人际交往模式,着重研究涉及社会热点问题的异常人群的人际关系网络,并尝试性地给出构建基于微博的异常人群的人际关系网络模型的算法,旨在为公安情报分析及舆情预警提供一定的依据。
  一、概述
  “微博”一词源自于英文单词microblogging或microblog,比更早兴起的博客在文字表示上更为简短,是继博客衰落之后的又一主要社交应用。微博作为互联网的新生事物,它的主要的特征是:一,微小,有字数限制,简短;二,共享,这主要体现在转发的功能上,通过转发信息表达自己的意见的态度;三,公开,微博是面向大众的私人媒介。
  中国微博经过长期积累,已经形成了以门户微博为主导,垂直类微博、微博功能类产品多元发展的环境。经过了多年的发展和培育,微博已经拥有了非常可观的用户和多元的群体。数据显示,作为全国90家微博网站的代表,截至2013年3月底,新浪微博注册用户数已经突破了5.36亿,日均活跃用户数达到了4980万;腾讯微博注册账户数为5.4亿,日均活跃用户数已超1亿。这些庞大的用户群体支撑起了微博网站的发展,同时也将人际网络从现实生活更明显地转移到了网络世界中来,人际关系也呈现出与以往不同的特点。
  微博平台由于其开放性、平等性和草根性的特征,逐渐地成为主流民意的网络汇聚地,任何一件在微博用户身边发生的大小事,都能通过发布微博而得到迅速、广泛的传播。因此,公安机关的情报工作也必须顺应形势,随之将微博作为重要的工作基地,尽可能全面地掌握微博舆论走向,控制事态的发展,同时将微博作为研究新型网络人际关系的重要工具,找出活跃用户、异常人群与粉丝的人际关系模式,发现热点话题的传播新特点,为公安机关引导微博舆情提供
  便利。
  二、微博传播中的人际关系
  1.人际传播与微博传播
  传播学者郭庆光认为:“人际传播(interpersonalcommunication)是个人与个人之间的信息传播活动,也是由两个个体系统相互连接组成的信息传播系统。它大致分为两种方式:一种是面对面的传播,另一种是借助某种有形的物质媒介的传播”。这一论述说明借助有形的物质媒介也是形成人际传播的方式之一。另外,吴文虎先生也曾在其专著中明确指出:“人际传播是……包括利用电话、书信、网络等媒介协助进行的传播”。从这个层面上来说,微博传播应属于人际传播的一种形式。
  2.微博人际关系与现实人际关系的异同
  微博的出现,极大地丰富了人们在日常生活中交往、沟通、联络的方式,由于传播媒介的网络化,微博的人际关系在继承了现实人际关系的属性之外,也产生了自己的发展
  特点。
  微博中的人际交往与现实中的人际交往有着高度的相关性与相似性,从某种意义上来说,微博中的人际关系是现实人际关系在网络虚拟世界的映射,虽然微博人际交往在交往过程中所采取的方法和载体与现实社会中有所不同,但并没有改变传统的人际交往关系格局。另一方面,与传统的交往方式相比,微博人际关系整体上更加松散,交往主体之间呈现出交往的不连贯性与不稳定性;同时,微博交往过程中微博主体往往更加注重张扬自己的个性,在表露自我的情绪和思想时往往更加放松和大胆。
  三、研究微博人际关系网络模型的公安情报
  意义
  1.监控社会异常动态
  互联网早已成为公安情报工作的一个重要的信息来源,网络监测手段在公安情报工作起到过巨大的作用,但近年来,由于信息爆炸和大数据时代的到来,以这种方式收集情报变得越来越困难。在微博这一新型社交平台出现了以后,微博的服务商为了防止商业价值降低而拒绝开放微博内容,导致传统的基于网页的搜索引擎在微博信息收集工作中难以利用。作为一种随时随地记录生活点滴的即时通讯方式,微博在事件报导,特别是用户身边社会异常动态反馈方面有着杰出的表现,而这些社会异常动向正是公安情报机关工作时需要收集的重点内容。
  2.促进公安与群众互动
  微博具有极强的互动性,主要体现在两个方面。其一,公安微博已成政务微博新秀。以新浪、腾讯微博为例,截至2012年年底,新浪微博实名认证政务机构账户达34539个,腾讯微博实名认证的政府机构达59161个。其中,公安司法相关机构用户占比为32.2%,影响力为总体政务微博影响力的五成。此影响力指数足以说明公安微博在微博用户心中所占的重要地位。其二,微博传播具有蝴蝶效应,用户不经意发布的一条信息,通过转播和评论便可能在互联网上引起非常广泛的关注。以新浪微博为例,一般活跃用户至少会有几十个关注者,微博达人更是会有百人以上的关注者。在“关注就是力量,围观改变中国”的观点甚嚣尘上的时代,任何有关社会异常情况的消息都会引起巨大的反应。
  因此,以人为本,构建基于微博的涉及治安侦查等问题的社会热点事件的人际关系网络,对于公安情报工作来说具有重要的意义和实战价值。
  四、微博中异常人群的人际关系网络模型算法研究
  (一)异常人群的确定
  在构建人际关系模型的架构之前,首先要确定异常人群的范围。
  1.微博用户分类
  中国微博用户群体层级众多、立场多样,名人微博、政务微博、媒体微博、境外机构微博、企业用户微博和草根微博均是微博舆论的重要参与者。根据微博用户的规模、行为习惯及心理特征,微博用户可以分为两大类:个人用户和机构及组织。在个人用户中,人群年龄跨度较大,年龄范围一般为10—60岁,其中以18—35岁的青年、中年为主体。机构及组织用户使用微博,主要是从事以营利为目的的经济活动,进行微博营销,包括进行网站推广、信息发布、在线调研、顾客服务、销售渠道等行为。从本质上说,企业使用微博是为了提高企业知名度,树立企业品牌,扩大经济效益。   2.“异常人群”的概念
  根据公安工作的需要,我们所要监测和管控的异常人群应该是在微博舆论场中占据着人际关系网络的关键结点位置,对当下的公共热点事件评论或转发将会带来倍数级二次转发或评论的微博用户。此类用户由于粉丝数量庞大,且绝大多数粉丝对于博主的发言、原创微博等会无条件追随,因此其所带来的微博传播效应是呈指数级增长的,如果这类用户对某些当下的涉及到公安机关事务工作的治安或侦查类社会热点事件进行观点明确的评论或转发,那么其所带来的“蝴蝶效应”将导致此事件立刻升温,短时间内引起最大程度的关注,因此这类人员应该是公安机关重点关注的
  对象。
  3.“异常人群”的确定
  公安机关所要关注的“异常人群”是微博当下时事热点事件中的关键人物群体。上述两类微博用户中的绝大部分,都不具备在短时间内引起大范围影响的条件,但是在与具体的社会热点事件连接起来的时候,普通的个人用户也可能瞬间变成敏感源,从以前不知名的“草根”迅速转变为热点话题的中心。因此,每个用户都存在着“突变”为异常人群的可能性。
  (二)微博中异常人群人际关系模型算法的给出
  人际关系网络是指一群人按照某种特定的规则连接在一起构成的一个系统。微博的人际关系网络就是在微博的用户关注与被关注、参与转发评论话题的社交规则下所连接起来的一个网络。研究微博的异常人群人际关系模型,必须以涉及治安侦查等社会热点事件的异常人群为中心,以微博中参与转发评论及关注该热点事件的微博用户为研究对象,建立关于热点事件的人际关系网络。
  1.算法说明
  微博的人际关系网络的形成,是跟微博的传播特性密切相关的。由于微博中的人际关系主要是围绕着关注与被关注、转发、评论这三种行为联系起来的,因此我们在构造微博中异常人群的人际关系网络模型算法时主要考虑这三种行为所产生的关系,将其分别对应于关注与被关注关系、转发关系及评论关系。又因为所要构建的人际关系网络是基于微博中的热点事件所产生的,转发行为和评论行为更能体现出微博热点事件的传播性质及异常人群的影响范围,因此围绕事件进行的转发关系及评论关系可以吸收关注与被关注关系,即如果有用户在转发和评论了该热点微博的同时又是发布该微博的用户的粉丝,那么将这种关系归入到转发关系中,其中转发关系既包括用户单纯的转发,也包括用户在转发的同时进行评论。同时,评论关系是指单纯的评论行为,不包括转发行为。
  2.算法具体步骤
  在构造微博中异常人群的人际关系网络模型之前,需要准备的数据是所研究的热点事件中涉及到的所有异常人群的全部信息,包括每个人的粉丝属性、与热点事件相关的转发属性及评论属性。由于微博传播是实时进行的,所以需要动态地搜索热点事件的涉及人群,实时将新发现的人员加入到异常人群数据库中。如果将所要构造的网络中的个体用节点来表示,个体之间所存在的关系用边来表示,那么基于微博的异常人群的人际关系网络模型算法可以这样来描述。
  算法输入:异常人群数据库中某一节点,属性包括其粉丝情况、关注情况、转发及评论热点信息情况。
  算法输出:异常人群人际关系网络。
  具体操作:
  (1)从异常人群数据库中读取一个节点加入网络构造表;
  (2)遍历网络构造表中存在的所有节点,如果满足以下条件,则在网络中增加一个新节点,并与步骤1中的节点相连:若新加入的节点转发或转发并评论过步骤1中节点的热点微博,则相连形成转发关系;若新加入的节点仅评论过步骤1中节点的热点微博,则相连形成评论关系;若新加入的节点既未转发也未评论过步骤1中节点的热点微博,但关注了步骤1中的节点或被步骤1中的节点关注,则相连形成关注与被关注关系;
  (3)设定时间条件,当经过某个时间段后,重新遍历异常人群数据库,每个新节点都有可能与网络中节点相连,每个网络中的旧节点也有可能与网络失去联系。
  (4)重复步骤1、2,直到异常人群数据库中的所有节点全部被读取完毕、网络生成为止,如需更新网络,则执行步骤3。
  根据这个具体操作算法,异常人群的人际关系网络生成过程可以用图1表示。
  五、结语
  研究微博中的人际关系网络对于公安情报工作具有重要意义,是公安工作推进信息化进程中的一条新路径,在关注涉及治安侦查类的社会热点事件的同时挖掘出主要相关人物及其人物关系网络图谱,为公安情报实战工作带来最实时、最深度、最有效的热点信息,从而协助公安机关管理网络热点,及时对热门话题进行监控和正向引导,并对网络舆情走向做出预测。本文的不足在于,由于所研究课题涉及到公安机关的相对敏感信息,在数据取得方面存在较大阻碍,无法将推演的算法通过实际数据得出相应的模型,因此下一步的研究目的在于取得实时数据,通过合适的工具将其嵌套进模型中,做出最贴合实际的人际关系网络模型,将测试结果应用于公安情报机关的实际工作中去。
其他文献
2009-2011年(每年11月1日至次年10月31日),由《证券市场周刊》主办的“水晶球奖”卖方分析师第一名推出的“30金股”收益率分别达到130.5%、53.3%、-14.1%,大幅超越同期上证综指
期刊
如何实现煤企思政工作新突破,打破思政工作目前被动的局面,是现代煤矿企业思政工作必须要面对的课题。本文在归纳分析煤企思政工作现状的基础上,对如何实现煤企思政工作新突破展
期刊
相对看好2012年上半年市场表现,成长型股票与价值型股票将交替反弹。    2012年较为确定的宏观环境是通货膨胀下降与经济减速。在此假设前提下,预期2012年全部A股的净利润增速下降至5%,整体ROE水平下降一个百分点左右至14%。与此同时,随着投资活动的收缩,预计市场广谱利率水平将自春节后出现显著下降。 无风险利率水平的变化必然对资产价格产生正面影响,在整个利率重置过程中,我们对于股票市场的估
至少在2012 年中期以前,经济难言底部,流动性层面的改善相对也并不明显,因此,股市依然处于存量资金的博弈中。    从投资时钟看,2012年多数时间经济徘徊在“衰退”、“谷底”阶段:地产继续去杠杆,上半年经济有破8%风险,“托底”最终还是靠投资。 预计2012年M2增速目标为13%-14%,新增人民币信贷7.5万亿-8万亿元。从政策取向上看,2012年坚持房地产调控,就会避免重蹈2009年覆辙,
经济主线并不明确,长期成长与短期增长存在逻辑上的冲突,持续赚钱效应难以显现,股市回落趋势没有改变。  国内民间借贷或其他金融风险催化实体泡沫消化将成为2012年中国经济关键词。 展望2012年, 因为A股市场周期股权重较高,周期股走势往往也决定了市场指数走势。历史统计规律说明:周期股最佳投资时间往往是“较低股票价格”和“较高的市盈率”,即股票和实体经济泡沫有所消化。从这个角度看,虽然A股市场经过两