基于均衡采样的P2P网络时变数据的近似聚集方法

被引量 : 0次 | 上传用户:liongliong576
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P(peer-to-peer)技术是未来重构分布式体系结构的关键技术,拥有广阔的应用前景。同时,随着P2P应用的广泛化与复杂化,将会有越来越多的应用所产生数据是随时间变化的。对于这些数据进行统计,将有助于用户分析这些数据的变化趋势并做出相应的决策。而聚集操作是统计方法中一个最为基本的操作,故在本文中将对P2P网络中时变数据的聚集方法进行研究。由于P2P网络具有大规模性、动态性、分散性等特点,使得在P2P网络中进行时变数据的聚集运算颇具挑战。本文针对这些挑战问题,主要进行如下几方面的研究:首先,由于P2P的大规模性,通过遍历每个节点来获取样本数据会出现处理时间过长、资源浪费较大等缺点。所以在本文中将利用随机采样的方式获取少量的样本数据,并利用这些样本数据来估计总体的聚集值。考虑到P2P网路的动态性等因素,本文利用全概率公式、Markov过程的收敛特性及Metropolis-Hastings等数学手段对动态网络中的均衡采样问题进行了深入研究,并首次提出了适应动态P2P网络的均衡采样算法——USTPF算法(Uniformly Sampling based on Total Probability Formula),同时我们利用理论与实验证明了该算法的正确性及有效性。其次,由于P2P网络中的数据是时变的,从而需要保证聚集运算中使用的所有样本数据均在时间上是有效的,这就要求时变数据的聚集算法能够在较短的时间区间内完成数据收集工作。为了达到上述目的,本文在均衡采样算法(USTPF算法)的基础上,利用中心极限定理、Chebyshev不等式等数学方法,首次构造出能够获得某一较短时间段内,P2P网络时变数据的近似聚集值的算法——AUS(Aggregation based on Uniformly Sampling)算法,同时本文利用理论与实验证明该算法在统计学中及实际应用中的意义。最后,由于P2P网络时变数据聚集值的历史信息同样十分重要,所以须解决如何在网络中存储时变数据聚集值的问题。针对该问题,本文提出了通过在网络中选取一部分节点构成档案节点集合,利用这些档案节点来存储时变数据聚集值的历史信息的方案,并给出了档案节点集合的选取算法——LCDS近似算法,通过理论证明与实验验证了该算法的正确性及有效性。
其他文献
<正>目的了解近些年来强迫症在心理治疗方面的研究进展及动态。方法以最近10年国内外有关强迫症研究的成果为基础,采用文献研究法分析与总结有关的研究论文和一些相关的治疗
会议
近年来,零售商自有品牌的研究逐渐成为国内理论界的一个热点课题。本文从国内外自有品牌定义、影响自有品牌成功发展因素、零售商开发自有品牌的动机、发展策略、自有品牌的
财政收入与GDP的关系是一个备受关注的理论与实际问题,本文提出了两者协调关系的界定与分析框架,辩证地理解"国"与"民"的富与穷问题,并评析了所谓的"国富民穷"之说。
地膜加小拱棚双覆盖栽培薄皮甜瓜(俗称香瓜),这种形式是目前我地区主要推广的一种栽培模式,面积在逐年扩大。它具有成本低、经济效益高、便于管理、容易搬迁倒茬等优点,是比较
统计资料作为一种信息产品在经济生活中发挥着重要的作用。我国政府统计信息的供给无论在数量还是质量上都与社会公众的需求严重相脱节,政府统计行政执法的改革已势在必行。
在玉米不同自交系基因组间存在着丰富的SNPs(single nucleotidepolymorphisms)和InDels(insertion/deletion polymorphisms),这为开发SNP分子标记、鉴别不同等位基因型提供了便利
人口年龄结构是动态变化的,与之相关的居民消费量也不断变动。文本探究了我国人口年龄结构对居民消费行为的影响。通过生命周期理论、家庭储蓄需求理论以及消费结构理论论证
研究了0℃冷藏条件下,不同厚度保鲜膜包装处理对白熟期采收冬枣的贮藏保鲜效果。结果表明,薄膜包装能够保持冬枣较好的硬度,减少乙醇累积、果皮转红和腐烂的发生,降低可溶性固形
依据GB/T 4340.1—2009对某铜管进行了显微维氏硬度测试,并对显微维氏硬度测定结果的不确定度进行了评定。结果表明:当置信概率取95%时,该铜管的显微维氏硬度的测定结果为(86
依据GB/T 230.1—2009规定的试验方法,利用Wilson 2001T洛氏硬度计对某钢厂X70管线钢进行了洛氏硬度(HRB)试验,从试验重复性、硬度计复现性等多方面对洛氏硬度试验的不确定度