基于Spark Streaming 实时数据采集分析系统设计

来源 :网络新媒体技术 | 被引量 : 0次 | 上传用户:storm369
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据量的实时数据分析系统,需要快速的处理和响应.为了实现实时数据分析,本文设计了基于Spark Streaming的实时数据采集分析系统,并对有状态计算操作的基数计算的精确计算方法和估算方法进行了比较分析.实验表明,基于HyperLogLog++的基数估算方法在处理时间和存储占用空间上有明显优势,而计算偏差基本可以忽略不计,更适于大数据的基数估算.“,”Real-time data analysis systems with large amounts of data require fast processing and response.In order to realize real-time data analysis,this article designs a real-time data collection and analysis system based on Spark Streaming and analyzes the performance between exactly and approximately counting in cardinality counting for the stateful operation.Experiments show that the cardinality estimation method based on HyperLogLog + + has obvious advantages in processing time and storage space,and the impact caused by relative deviation is negligible,which is more suitable for the cardinality counting in real-time large data analysis.
其他文献
6月11—15日,2017年南方航机务维修岗位技能竞赛决赛在广州顺利举行。本次竞赛最终产生单项冠军18名,团体奖项6个,个人综合奖10名。为了对此次竞赛的优胜选手进行表彰,广东省
期刊
与传统飞机相比,新一代飞机上产生的运营和维修数据呈现数量级增长.新一代飞机不仅能够收集更多与飞机运行相关的数据并下载至地面,还能够处理越来越多从地面上传的天气、软
期刊
20世纪50年代,计算机开始在象棋领域战胜人类,证明数学定理,让人类狂喜不已.60年代,人们越来越希望,不久以后,科学家就能用硬件和软件复制人类大脑,「人工智能」可以完成任何
期刊
CFM56发动机在投入运营40余年后,凭借其较高的可靠性和优良的性能仍占据着民航市场的重要地位。据预测,CFM56发动机的在役数量将在2018年达到峰值,也意味着几年后维修市场即
期刊
某型飞机雷达罩喷涂室建设项目是为了满足某型新机维修需要而投资建设的一个小型项目。以该项目为例,从项目论证、策划、实施、竣工验收、总结评价等方面的内容和要点出发,介
机载干涉仪天线的安装精度要求高,传统安装定位方法需要的人员多、工时长,并且无法保证精确度。本文提出一种基于几何原理的机载干涉仪天线安装定位方法,使用全站仪和相似三
针对某型飞机平尾前缘再制造过程中出现的重量超差问题,根据平尾前缘的结构形式对其结构强度和重心、飞机重量重心、飞机尾翼颤振特性等因素进行分析计算,并结合工艺优化情况
近日,GE航空宣布开始进行第二台GE9X原型发动机的认证测试。随着第二台GE9X发动机在皮伯斯测试台上开始试验,第3台和第4台GE9X发动机的装配也在GE航空的总部——位于俄亥俄州
期刊
目前,高房价已由北京、上海等一线城市向二、三线城市蔓延,然后转向四线甚至更小的城市,全国房价在政策“空调”之后再度发力引起社会各界的广泛关注和批评。在保障房稀缺如
MSG-3 Vol.1在民用固定翼飞机维修大纲的运用上已经很成熟。近年来,随着维修理念的不断发展,对旋翼机安全性和可靠性的要求不断提高,运用MSG-3 Vol.2的方法为旋翼机制定维修