社交网络中社区与用户兴趣分析——模型设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户：qqww1234cc

【摘要】

：

随着网络的发展，网络不断地融入到人们的生活之中，网络与人的关系越来越密切。人们活跃于各种流行的社交网络之中，用户间形成的关系构成了一个大规模的用户关系网络;用户在社交

【作者】

：

吴良

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2014年期

【关键词】

：

社交网络分析社区发现话题模型用户兴趣

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络的发展，网络不断地融入到人们的生活之中，网络与人的关系越来越密切。人们活跃于各种流行的社交网络之中，用户间形成的关系构成了一个大规模的用户关系网络;用户在社交网络之中不断的发表与自己生活、工作等相关的文章，文章之间的引用或者回复等关系形成了一个大规模的文档网络。　　社区随着社交网络的发展而自然形成，不同的用户在不同的社区中影响力、活跃度都不相同，不同的社区所讨论、流行的话题也不尽相同。因此，从社区层次对社交网络内容进行分析，可以增加对网络中话题形成的理解、提高话题发现的准确性，更好的分析用户影响力的形成和社区层次的很多语义信息。同时，处于同一社区用户的兴趣、具体关注的事物也是不同的。所以，对社交网络内容从用户层次进行分析，才能更好的、更细粒度的分析每个用户的兴趣、用户的行为发生等用户层次语义信息。　　因此本文在社区层次与用户层次上由宏观到微观不同角度分析挖掘社交网络的内容中有用的语义信息。本文同时考虑了用户发表的文本信息、文本中所包含的用户间关系。　　在社区层次，如何根据用户关系图、文档图挖掘出用户形成社区、社区中用户的影响力以及各个社区热门的话题等社区层次语义信息，是一个重要的问题。在本文的工作，认为这几个问题是相互关联的，本文利用这些问题之间的关联性同时建模，相比于这几个问题单独分析，会取得更好的结果。本文提出了一个集成社区发现功能、话题分析功能和社区内用户影响力分析功能的基于LDA的概率模型，ACT(Author-Community-Topic)-LDA，利用变分推理学习参数，利用在线学习的方式应对大数据环境。本文利用社区中的话题概率分布建模社区划分的语义信息。在DBLP数据集、微博数据集上的实验取得了非常好的实验结果。本文设计和实现了ACT-LDA模型，将其应用到具体的项目工作之中以供在线使用。　　在用户层次，本文对用户兴趣进行了建模。对于大规模的社交网络，用户的数量以及用户所关注的事物总量非常庞大，随着网络的增长不断增长，因此这种大数据环境下建模每个用户的兴趣、任何两个用户间兴趣相似度的代价是非常大的。本文提出了基于深度学习(deep learning)的用户兴趣模型，借鉴了最新的谷歌Word2Vec模型，可以准确且快速的学习出用户的兴趣，并且计算出用户间的兴趣相似度，得到用户最感兴趣的关键字以及与用户兴趣度最相似的用户集合。模型同样基于在线学习方式，适应于大数据环境。本文设计和实现了SN2Vec模型，DBLP数据集、微博数据集上的实验取得了很好的结果。未来将进一步整合到具体的项目工作中以实际在线使用。

其他文献

雷达天线指向与稳定测试系统计算机接口设计与软件开发

以运动平台为载体的雷达,如机载、星载、车载和舰载雷达,它们一般都需要实现空域指向稳定,即雷达天线波束的空间指向不能因为载体的运动而改变.要判定雷达的空间指向位置是否

学位

摇摆转台ISA总线自动测试系统虚拟设备驱动程序面向对象编程

普适计算中间件平台及其支撑技术研究

在传统的计算模式中,用户关注如何使用计算机；用户格式化的输入是计算机提供服务的前提。随着时代的发展,人们希望计算机变得更易于使用,并能够主动、智能地为用户提供服务。

学位

普适计算上下文感知中间件平台行为识别传感器数据分片事务模型

封封来信一片赤诚同心协力办好川报——川报有奖征求意见读者热烈响应

据川报总编室负责人说,川报于去年十二月二十五日刊登“有奖征求读者意见”启事后,得到广大群众热烈支持,截至今年二月十日止,已收到来信两千多封。编委会组织专人及时处理

期刊

内部材料编采人员编辑方针改革方案定川革命精神工作方法

电子采购系统中招投标数据安全技术的研究

　　本文通过对现实电子采购网上存在的安全威胁进行分析，提出和设计实现了上述目标的解决方案。　　本文实现的解决方案涉及到加解密算法，PKI架构，SSL协议和身份认证技术。文中

学位

电子采购数据安全工程PKI体系密码算法数字签名身份认证SSL协议

基于数据挖掘技术的软件可靠性模型研究

随着软件应用的日益广泛及重要性的不断增加，人们对软件质量的要求也越来越高，可靠性作为衡量软件质量的重要特性，其定量评估和预测已成为人们关注和研究的焦点.实践证明，软件可

学位

软件软件可靠性早期预测模型增长模型数据挖掘贝叶斯网络聚类分析时序分析ARIMA模型

MDA及其支撑工具的研究

随着计算技术和远程通讯技术的迅速发展，出现了很多复杂的分布式应用系统。为了简化异构环境下分布式应用的集成和互操作，自上世纪90年代开始，工业界先后出现了许多功能强大的中

学位

模型驱动体系结构模型转换UML中间件系统集成软件开发框架代码生成

面向医药领域的用户检索请求分析技术研究

随着信息技术的发展。尤其是互联网的普及，互联网上的信息呈现爆炸性增长，可获取的信息资源的种类和数量不断扩大，人们已经从以往的“信息匮乏”状态进入“信息过剩”状态，基于搜

学位

用户检索请求分析医药领域自动问答系统检索请求预处理特征提取领域本体问题相似度

积极心理学:对传统心理学的继承和超越

积极心理学(positive psychology)是20世纪末在西方兴起的一股重要心理学力量.有人认为积极心理学是不同于传统主流心理学,而且过分夸大了二者之间的不同,甚至说积极心理学是

期刊

积极心理学传统心理学继承发展

面向连续绘制的在线草图理解方法研究

随着计算机硬件的发展，笔式交互作为一种高效、自然的人际交互方式，得到了快速的发展和广泛的应用。笔式人机交互中有一个非常关键、困难的问题就是如何让计算机理解人们绘制的

学位

绘图连续绘制计算机辅助制图人机交互在线草图理解理解方法

浅谈电视记者的新闻敏感

新闻敏感是指新闻工作者对客观事物的新闻价值的判断能力,西方称为“新闻鼻”。它是新闻工作者对社会现象的观察能力,对事物发展变化的反应能力,对新闻线索的识别能力,以及对

期刊

电视记者新闻敏感新闻工作者新闻线索新闻价值反应能力政治敏感电视新闻摄影新闻题材中国广播电视

社交网络中社区与用户兴趣分析——模型设计与实现

与本文相关的学术论文