基于隐马尔科夫理论及条件随机场的微博网络信息扩散模型

被引量 : 0次 | 上传用户:sbsb5503564
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的蓬勃发展,信息呈现爆炸式的增长,我们随之步入了大数据时代。为了更好地挖掘社交网络的潜在价值,众多学者都对之进行了各方面的研究。那么,如何充分地利用社交网络中的信息并对之进行有效地控制和引导?如何深入地了解信息的扩散机制?如何正确预测社交网络中的用户行为?对之行之有效的一个研究方向就是构建准确、可解又唯美的信息扩散模型。微博(Micro-blog),作为一种新型的社交网络平台,有传统社交网络的共性也有其个性。目前,有关微博网络的信息扩散模型研究,综合考虑信息内容、用户及网络结构的研究屈指可数。再者,既考虑信息间的“竞争关系”又考虑“合作关系”,且基于统计概率的多信息扩散模型则基本没有。鉴于此,本文提出了微博网络中基于隐马尔科夫理论的信息扩散模型(IDMBHMT)和基于条件随机场的多信息扩散模型(MIDMBCRF)。首先,本文综合研究了微博网络信息扩散的特点及影响因素、隐马尔科夫理论、条件随机场理论以及本文相关的特征函数定义方法(自动中文文本分类、用户相似度度量以及多信息交互的量化方法),构建了微博网络中基于隐马尔科夫理论的信息扩散模型(IDMBHMT)和基于条件随机场的多信息扩散模型(MIDMBCRF);其次,本文使用METIS工具对微博用户关系网络进行子图划分,并基于子图进行模型的构建,以此优化模型的性能;再者,本文使用Junction tree算法将模型应用于用户的转发行为预测;最后,使用新浪微博API(Application Programming Interface)抓取实验数据进行仿真实验。实验分析了两个模型的性能影响因素:图划分技术提高了模型的性能,且当子图规模为48时,两个模型的性能达到峰值;“多信息交互”以平均43%的概率对MIDMBCRF模型的转发概率产生影响。在网络规模分别为120、240和400的情况下,将IDMBHMT模型及MIDMBCRF模型分别与基于逻辑回归的转发行为预测模型(RPMBLR)及基于LT(Linear-Threshold)的多信息扩散模型(MIDMBLT)进行性能对比,四个模型的性能由高到低排序为:MIDMBCRF、IDMBHMT、RPMBLR、MIDMBLT。本文所构建的两个信息扩散模型,不仅可以应用于用户行为预测和舆论引导,而且其研究成果对其他相关学科研究存在借鉴意义。
其他文献
<正>《将进酒》为唐代伟大的浪漫主义诗人李白于天宝三载(744)即兴而作。诗人当时与好友岑勋在另一好友元丹邱家中做客,此时诗人由于受排挤被迫离开长安,去时豪情万丈踌躇满
<正>一、何为“多元解读”文学解读从其本质属性上来讲,是主体间性的对话,是主体间性的一种寻求心灵交流的活动,是读者与文本双向活动的一种解读反应过程。文学解读的这种本
汉字是汉民族文化积淀的反映。本文对《说文》所收山部字进行简单的义类划分,进而阐释山部字所蕴涵的山岳崇拜思想和审美意识。
随着全球化的浪潮,越来越多的企业开始选择通过并购的方式来实现业绩的高成长。然而,令人遗憾的是,市场成功的并购并不多见。相关统计资料表明,70%的并购从长远来看都是失败的,导致
《第四十一》、《恰巴耶夫》和《毁灭》这几部小说用不同的方式折射出时代精神。作品都以战争与人的命运的关系作为结构特点,写典型环境中的人物性格,且都能直面革命队伍的失
<正>在色块植物应用中,龟甲冬青用得最多,适应性较好,但也出现了很多问题,尤其是沿海地区,在园林绿化中盐碱地占有一定比例,而龟甲冬青一旦配置在盐碱地带,植株就会生长不良
<正>【教学目标】1.能说出小说的三要素;2.初学多角度把握小说主题的方法;3.感受作者悲悯的情怀,获得对人生的有益启示。一、听歌曲激趣,引出课题同学们,老歌《幸福在哪里》
全球经济危机过后,各国都在寻找下一轮经济增长的新动力。我国于2009年提出培育发展战略性新兴产业,选定节能环保、新一代信息技术、生物、高端装备制造、新能源、新材料和新能
自新中国成立后,我国的高等教育经历了三次重大的调整和改革,第一次调整是1952年至1957年的“院系调整”,这次调整开启了我国高校培养专门人才的基本格局;第二次的调整是1978年开
宁波梅山保税港区座落在北仑区梅山岛,距宁波市中心40公里左右,2008年2月24日获批设立,成为继洋山、天津东疆、大连大窑湾、海南洋浦之后的中国第五个保税港区,规划面积7.7平