SHELL：一种面向流数据的实时基数估计算法

来源 :南京邮电大学学报：自然科学版 | 被引量 : 0次 | 上传用户：strong_zht

【摘要】

：

基数计算在流数据查询优化、网络安全、数据压缩等领域具有重要的应用价值。现有的基于概率统计原理的基数估计算法需要通过扫描历史静态数据才能进行基数统计,由于流数据具

【作者】

：

刘尚东张殿超尧海昌姚橹叶青季一木王汝传

【机构】

：

南京邮电大学计算机学院,南京工业职业技术学院计算机学院,南京邮电大学江苏省无线传感网高技术研究重点实验室,南京邮电大学先进技术研究院,南京理工大学高维信息智能感知与系统教育部重点实验室

【出处】

：

南京邮电大学学报：自然科学版

【发表日期】

：

2017年4期

【关键词】

：

大数据处理技术流数据基数估计并行化算法 big data processing techniques stream data cardinality ev

【基金项目】

：

国家重点研发计划（2017YFB0202200）, 国家自然科学基金（61170065,61373017）, 江苏省重点研发计划（BE2017166）, 江苏省自然科学基金优秀青年基金（BK20170100）, 南京理工大学高维信息智能感知与系统教育部重点实验室开放基金, 江苏省无线传感网高技术研究重点实验室开放基金（WSNLBZY201514）, 南京邮电大学校级科研基金（NY214067）资助

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基数计算在流数据查询优化、网络安全、数据压缩等领域具有重要的应用价值。现有的基于概率统计原理的基数估计算法需要通过扫描历史静态数据才能进行基数统计,由于流数据具有持续、快速和实时等特点,不可能先持久化再处理分析,因而传统的基数估计算法无法直接应用在大数据流处理中。通过研究Spark、Storm实时分布式流处理机制和传统基数估计算法,设计和实现了实时的流数据基数估计算法SHELL（Streaming HypErLogLog）,实验表明,SHELL在保证精确度不降低的情况下,单位滑动时间窗口内处理的消息量达到

其他文献

浅析问题式教学在高中地理课堂中的应用

教学改革时期的高中地理课堂,教师积极尝试问题式教学方法,促进学生在课堂学习中的积极思考,通过教学环节的精心设计、教学氛围构建在课堂内培养学生的问题意识和探究思想,促

期刊

问题式教学高中地理应用实践分析

农业生产方式对土壤肥料的主要影响及对策

影响农业生产水平的因素有很多，例如气候条件、水分、地理环境等，土壤是植物赖以生存的基础，土壤以及土壤中的肥料情况对植物生长有很大影响。该文从农业可持续发展的角度出发对

期刊

农业生产可持续发展土壤肥料

浅析玉米联合收获机主要部件故障监测系统

该文重点介绍了玉米联合收获机的自动化故障监测系统的相关原理和要求,包括在机器运转的过程中对割台、剥皮机等主要部件的转速进行监测,针对可自行修复的因堵塞造成的运转异

期刊

玉米联合收获机割台故障监测故障诊断预警报警

室内非视距环境中60GHz电波传播特性仿真与分析

毫米波波段,尤其是60 GHz频段已经被认为是最有前途的并且能够分配大量频谱空间的频段。文中基于SBR/Image方法对室内非视距环境中60 GHz电波传播进行了研究,仿真结果与已知

期刊

60GHz频段毫米波接收功率室内非视距环境60 GHz frequency band millimeter-wave the received p

基于FPGA的以太网MAC协议的设计与实现

随着互联网的飞速发展,以太网的应用也越来越广泛,速度也越来越快。在网络安全领域,通常使用网络过滤设备来对大量的以太网数据包进行分析。网络过滤设备正常工作的关键是对

学位

以太网MACFPGAVerilog

L—模糊拓扑空间的 α—连通性

在Ｌ－模糊拓扑空间中，引进了α－连通性的概念，研究了它的某些性质；给出了α－连通分支的定义，最后讨论了拓扑生成的Ｌ－模糊拓扑空间的α－连通性的性质。

期刊

模糊拓扑空间LF拓扑空间α连通性连通性fuzzy topological space connected

模幂运算的一个递归算法

模幂算法广泛应用于公开密钥加密技术。在分析已有模幂算法基础上,提出模幂算法的递归实现,省去了模幂算法中指数的二进制化过程已经对指数的扫描过程,简化了算法。

期刊

模幂算法逆归复杂度modular exponentiation algorithm recursive time complexity

地面三维激光扫描技术在龟山汉墓测量和重建中的应用

随着科学的不断发展，各种技术突飞猛进，半导体和微电子技术取得了重大的突破，导致超大规模集成电路和数字传感器技术的极速发展。电子技术的发展，导致了与之相关的测绘技术的发展

学位

三维激光扫描技术点云数据三维模型龟山汉墓重建

基于SLIC超像素分割显著区域检测方法的研究

近年来,图像显著性区域检测已经成为图像处理与分析的热点领域,RC方法是这一领域较为出色的算法之一,然而该方法存在预分割方法不精细、区域显著值分配误差较大等缺陷。为了

期刊

显著性探测MeanShift平滑SLIC超像素分割区域对比度saliency detection Mean Shift smoothing SLIC

土壤肥料与农产品质量的关联与分析

农产品质量的优劣与人类日常生活水平和身体健康息息相关,生产出适口的、健康绿色的农副产品,必须从保护土壤和合理施肥做起.文章以湖北省孝昌县土壤肥料工作站实施的测土配

期刊

土壤肥料农产品质量关联分析

SHELL：一种面向流数据的实时基数估计算法

其他学术论文