SHELL:一种面向流数据的实时基数估计算法

来源 :南京邮电大学学报:自然科学版 | 被引量 : 0次 | 上传用户:strong_zht
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基数计算在流数据查询优化、网络安全、数据压缩等领域具有重要的应用价值。现有的基于概率统计原理的基数估计算法需要通过扫描历史静态数据才能进行基数统计,由于流数据具有持续、快速和实时等特点,不可能先持久化再处理分析,因而传统的基数估计算法无法直接应用在大数据流处理中。通过研究Spark、Storm实时分布式流处理机制和传统基数估计算法,设计和实现了实时的流数据基数估计算法SHELL(Streaming HypErLogLog),实验表明,SHELL在保证精确度不降低的情况下,单位滑动时间窗口内处理的消息量达到
其他文献
教学改革时期的高中地理课堂,教师积极尝试问题式教学方法,促进学生在课堂学习中的积极思考,通过教学环节的精心设计、教学氛围构建在课堂内培养学生的问题意识和探究思想,促
影响农业生产水平的因素有很多,例如气候条件、水分、地理环境等,土壤是植物赖以生存的基础,土壤以及土壤中的肥料情况对植物生长有很大影响。该文从农业可持续发展的角度出发对
该文重点介绍了玉米联合收获机的自动化故障监测系统的相关原理和要求,包括在机器运转的过程中对割台、剥皮机等主要部件的转速进行监测,针对可自行修复的因堵塞造成的运转异
毫米波波段,尤其是60 GHz频段已经被认为是最有前途的并且能够分配大量频谱空间的频段。文中基于SBR/Image方法对室内非视距环境中60 GHz电波传播进行了研究,仿真结果与已知
随着互联网的飞速发展,以太网的应用也越来越广泛,速度也越来越快。在网络安全领域,通常使用网络过滤设备来对大量的以太网数据包进行分析。网络过滤设备正常工作的关键是对
在L-模糊拓扑空间中,引进了α-连通性的概念,研究了它的某些性质;给出了α-连通分支的定义,最后讨论了拓扑生成的L-模糊拓扑空间的α-连通性的性质。
模幂算法广泛应用于公开密钥加密技术。在分析已有模幂算法基础上,提出模幂算法的递归实现,省去了模幂算法中指数的二进制化过程已经对指数的扫描过程,简化了算法。
随着科学的不断发展,各种技术突飞猛进,半导体和微电子技术取得了重大的突破,导致超大规模集成电路和数字传感器技术的极速发展。电子技术的发展,导致了与之相关的测绘技术的发展
近年来,图像显著性区域检测已经成为图像处理与分析的热点领域,RC方法是这一领域较为出色的算法之一,然而该方法存在预分割方法不精细、区域显著值分配误差较大等缺陷。为了
农产品质量的优劣与人类日常生活水平和身体健康息息相关,生产出适口的、健康绿色的农副产品,必须从保护土壤和合理施肥做起.文章以湖北省孝昌县土壤肥料工作站实施的测土配