大型在线社交网络的高效高代表性采样方法研究

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:ddall
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线社交网络(Online Social Network,OSN)已成为有效连接人们和促进信息传播的重要平台,这对我们的社会生活和社会至关重要。但是由于隐私问题和访问限制,研究者很难获得整个社交网络的数据并对其进行分析,因此通过采样得到一个具有代表性的子图至关重要。但是由于同样的原因,我们缺乏原始网络作为参照,这对评估抽样方法的无偏性(尤其是代表性)提出了巨大挑战。因此,用户均匀采样方法(Uniform sampling of user IDs,UNI)[Gjoka et al.2010]被提出以获得原始网络的节点拓扑特性的无偏分布,从而用来评估其他采样方法的无偏性。然而,UNI采样效率低下,并且很少研究由采样节点及其之间的连接所形成的子图的代表性和连通性。故在本文中,本文提出了一种自适应UNI采样(adpUNI)方法,该方法通过将用户ID空间划分为多个均匀间隔并使得各区间采样概率根据其命中率自适应地变化来克服UNI采样效率低下的缺点。基于adpUNI方法,我们进一步将每次采样命中节点的邻居节点也添加到样本集中,这样可以进一步提高采样效率,并获得更具连通性和代表性的子图,我们将该方法称作adpUNI+N方法。最后,我们将提出的方法和其他经典的采样方法应用于新浪微博和Twitter的网络数据的采样,实验证明adpUNI和adpUNI+N在抽样效率上优于其他经典方法,并且始终具有比UNI抽样更好的连通性和代表性。此外我们还发现,一种较为无偏或均匀的采样方法并不能保证其采样子图更具有代表性。
其他文献
水稻(Oryza sativa L.)粒形与稻米产量和外观品质密切相关,近年来关于水稻粒形的研究引起了广泛的重视,越来越多的影响水稻粒形的基因相继被克隆,但其中绝大多数基因克隆自突
花期是观赏植物育种的主要目标性状之一。成株红掌可周年开花,但不同品种从试管苗移栽到开花的时间不同,成株开花效率也不一样。因此研究红掌开花特性的分子机理对推动红掌育
纳米材料表现出许多有趣的光电特性,在光捕获和发光设备领域有很大的应用可能性。随着纳米材料的开发,人们打开了一扇了解世界的特殊窗口。为了解决世界性的能源不足和环境污染问题,近年来,将太阳能转换成化学燃料的半导体光催化技术被广泛研究。在一些以半导体为基础的光催化剂中,CdS由于其对可见光响应的带隙相对较窄,并且导带边缘的负电势足以使质子还原,因此受到了广泛的关注。研究显示,基于CdS的半导体材料在利用
在本篇论文中,我们研究了二阶非线性微分方程-u"(t)=f(t,u(t),u’(t)),t∈[0,1]正解的存在性,其中f:[0,1]×R+×R+→R+是连续的.它的边值问题分别为u(0)-α[u],u’(1)=0,u(0)
黑颈长尾雉是世界濒危物种和我国Ⅰ级重点保护动物,地理分布非常狭窄,国内仅分布在西南部,国外分布在印度东北部、缅甸北部和泰国西部。近年来,随着经济社会的快速发展,黑颈
进入20世纪以后,随着科学技术及经济的发展,机械逐渐成为劳动力的主力。随着机械的增多,机械加工工序已经成为制约生产的瓶颈工序。人们在追求钢材质量的前提下,钢材的生产成
一年生野生大豆(Glycine soja Sieb.et Zucc.)是栽培大豆(Glycine max(L.)Merr.)的野生祖先,具有多花多荚、蛋白含量高及耐逆性强等优点,蕴藏着许多能拓宽栽培大豆遗传基础的
水稻直播近年倍受推崇,而保证水稻直播安全的重要条件之一就是种子的耐低温发芽力,所以研究水稻的低温萌发的遗传机理,将有助于提高种子的低温发芽力和培育适合直播的水稻品
选择性氧化反应与偶联反应一直以来都是化学领域当中的重要组成部分并且也是重要且富有挑战性的两类课题。传统的选择性氧化反应在氧化剂方面往往都需要消耗化学计量或者大大
辽东半岛顶端海域是渤海及北黄海水交换的重要通道。辽东半岛顶端海域上升流的存在,对其所在海域的动力环境、理化环境有一定的影响,为夏季海雾的形成创造了有利的条件,从而