在线社交网络的UNI64采样方法研究

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:wanghuaifei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线社交网络的迅猛发展吸引了大批学者对其进行分析和研究。大多数针对在线社交网络的实证性研究都需要基于真实的网络节点和网络结构数据进行。然而全网数据通常难以获得,因此需要通过研究网络采样方法来获得具有代表性的网络样本从而保证后续研究的顺利进行。虽然人们已经提出了许多针对网络的采样方法,但对这些采样方法优劣的评价需要一个无偏均匀的样本集作为评价标准。UNI方法则是一个能够提供无偏基准值的采样方法。然而由于在线社交网络用户ID系统的升级,致使UNI方法的采样范围急剧扩大,这使得UNI方法的采样命中率几乎为零,最终导致该方法无法使用。本文对在线社交网络采样方法的研究背景和意义进行了系统性地综述。分析了在线社交网络中UNI方法实际应用时存在的问题和弊端,提出了解决UNI方法在64位整数ID系统中无法使用问题的假设。然后以新浪微博为例,采集了近一亿条用户ID数据,并对用户ID的分布情况进行了统计和分析,发现了新浪微博用户ID的分布规律,同时验证了我们对于在线社交网络用户ID非稀疏分布的假设。而后,我们提出了UNI64方法,该方法借鉴层次聚类和贪心算法的思想,通过分析一定数量的网络原始ID样本,在整个ID系统中划分出有效区间,并控制UNI方法在有效区间内按比例进行采样,提高了采样命中率,从而解决了UNI方法在64位整数系统中无法使用的问题。随后我们通过实验从采样效率和样本质量两个方面对UNI64方法进行了检验,结果表明UNI64方法在真实在线社交网络上的实际采样命中率能够达到我们设定的目标命中率,并且得到样本的分布情况也与实际情况相符。
其他文献
以超声波辅助法提取所得的丰年虫油为原料进行动物实验,研究丰年虫油对高血脂症小鼠血脂的调节作用,并探讨丰年虫油对小鼠肝脏和脑组织的抗氧化作用。结果表明:丰年虫油能够
社会支持网作为社会网络分析研究的分支,是社会网络分析技术发展和应用的一大领域。本文首先回顾了社会网络分析技术和方法的发展,着重对社会支持网概念和测量进行了梳理。对
通过介绍不同类型养老地产的开发模式和经营模式,对于营利性养老地产用地性质和种类分别进行重点阐释,并结合国内现有的已开发成型的项目案例对养老地产的用地问题加以法律分
“模式识别”是解决数学问题经常用到的策略,以现代认知学习理论为依据,对它与数学分析教学的联系作了某些分析,并指出它在教学上一些应用.
在这个知识经济盛行的时代,要将我国建设成人才强国离不开对大学生创新能力的培养,创客运动的兴起为大学生教育明确了方向,创客是一群将自己的创意转变为现实的行动者,他们坚
立足供应链管理理论,在规划上将港口和物流园区两者合而为一,克服单一功能区的弊端,做到港口、物流、产业整体发展,并据此提出现代化的洋山深水港及物流园区的功能定位,从航
目的研究分析低位直肠癌保肛术吻合口瘘的原因以及对其预防的措施。方法选取2009年1月—2016年6月我院收取的153例接受低位直肠癌保肛术患者作为研究对象。按照术后吻合口瘘