内容分块算法中预期分块长度对重复数据删除率的影响

来源 :西安交通大学学报 | 被引量 : 0次 | 上传用户:mwd2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对基于内容分块重复数据删除方法缺少能够定量分析预期分块长度与重复数据删除率之间关系的数学模型,导致难以通过调整预期分块长度优化重复数据删除率的问题,提出了一种基于Logistic函数的数学模型。在大量真实数据测观察基础上,提出了通过Logistic函数描述非重复数据的“S”形变化趋势,解决了该数据难以从理论上推导、建模的问题,证明了基于内容分块过程服从二项分布,并从理论上推导出了元数据大小模型。基于上述两种数据模型,通过数学运算最终推导得到重复数据删除率模型,并利用收集到的3组真实数据集对模型进行了实验
其他文献
"走基层"报道是正在蓬勃开展的"走、转、改"活动的重要内容,也是转作风、改文风的前提。近两年来,广大广播电视工作者坚持以人为本,回应时代关切,迈开双脚,深入基层,采播了一大批
为综合得到三移动一转动(3T1R)混联机构,利用分形理论和机构拓扑图,提出了一种全新有效的混联机构型综合方法,主要思想是将混联构型转化为连杆机构,机构拓扑图作为连杆机构的主
对4A分子筛及其与Al(OH)。或(和)Mg(0H)。组成的复配体系作为软质PVC阻燃抑烟添加剂的性能进行了研究。结果表明:4A分子筛作为单一添加剂时,只有在添加量较大的情况下才对软质PVC有较
华南理工大学和西安建筑科技大学的研究人员完成了裂缝影响混凝土试件温度分布的试验研究和分析。试验设计考虑的实际情况为地震后受火灾影响的混凝土试件。试验包括9个带有
通常采用双目视觉技术实现对明火的空间定位,其中摄像机标定是双目视觉定位技术中的关键问题。基于线性模型,设计了自寻的消防水炮对明火自动检测与定位过程中的摄像机标定算法,实现了从世界坐标系到像素坐标系的转换,为控制消防水炮动作提供参数。实际测试表明,该方法计算速度快,精度高,具有较高的工程应用价值。
结合当今市场的数字化风潮,就国内编码器市场的现状和用户的需求来看,科技高速发展,编码器的主要发展趋势还是对其精度、分辨率提高要求,以及光电编码器的小型化和智能化等。
为了准确分析颗粒阻尼(NOPD)的能量耗散机理,拓宽颗粒阻尼在工程中的应用范围,根据分子动理论基本原理,建立非阻塞性颗粒阻尼能量耗散的定量模型。在振动流化床颗粒系统研究成
采用数值求解三维RANS方程和SST湍流模型的方法,研究了间隙结构对轮缘密封封严性能以及封严射流对透平级气动性能的影响。首先,分别对Aachen的一级半透平以及实验测得的轴向轮
一、市场研究的意义在市场竞争十分激烈的今天,不管对新企业还是老企业,不管是大企业还是中小企业,市场研究对企业的生存和发展都具有十分重要的意义.
思想政治工作是国企生存发展的基础,是国企得到约束管理的重要环节,是构建和谐社会的政治手段,也是以人为本的管理手段,对国企的持续深入发展有着积极健康的促进作用.