基于流式处理的数据采集系统的设计与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:zxw2yanzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,移动互联网和物联网的迅猛发展,催动全球数据量爆炸式增长。得益于低成本的传感和移动设备的支持,人类社会生产生活各方面产生的感知类数据日益增长。这类数据不仅体积和规模巨大,通常还具有实时到达、持续不间断、到达速度快等特征,常被归类到“流式数据”,使相应的基础服务面临愈加严峻的挑战。然而,现有数据采集工具较为笨重,开发者学习和管理成本高,实时性保证不足。本课题设计实现一套基于分布式环境的并行流式处理的数据采集方案,将Raft算法作为分布式一致性的解决方案应用于流式数据采集系统,改写了 Akka Cluster 框架 Distributed Subscribe Publish 的功能,增设了对广播消息的ACK确认机制,从数据的接入到分发全程流式传输,支持分布式和多层级的部署,作为流式服务基础设施的重要组成部分。从数据采集系统的功能和性能需求出发,制定了系统的总体设计方案,根据系统的功能模块,将系统分为安全验证模块、订阅管理模块、数据接入模块、系统状态呈现模块、数据存储模块和数据分发模块。每个模块独立不关联,并在实际部署时,实现物理逻辑层面的分离,使各个模块之间解耦,提高了系统的灵活性,复用性与容灾能力。最后,对基于流式处理的数据采集系统的各个功能点进行了测试,验证系统实现满足预期的目标,并对流式数据采集系统进行了归纳总结,提出了一些系统需要解决或优化的问题,对未来工作进行了展望。
其他文献
随着煤炭企业整合、重组,规模不断扩大,以及信息技术在各个行业中的深入应用,集团型煤炭企业现有的财务信息化系统远远不能满足企业快速发展的需要。分析了集团化煤炭企业现
目前,我国的教育在不断改革完善,小学是学生学习的基础阶段,也是培养学生学习兴趣和良好学习习惯的重要过程。鉴于小学生年龄小、认知能力不强,小学生思维也只是存在于表面的
儒家文化作为中国传统文化的主流价值系统,不仅在历史上产生过重大影响,而且对今天的社会生活也依然具有一定的启示意义。文章立足于图书馆管理这一特定角度,从儒家的人本思
春夏之交,气后变化大,是猪病多发季节,加上近期猪肉价格上涨,生猪调运频繁,疫病传播风险增大,养殖场须加强落实综合防控技术措施,确保生猪生产安全。当前重点要抓好以下几个
课堂教学是小学英语教学的主要组成部分,要如何提高小学英语课堂教学效率,是每一个英语教师都关注的问题。一门语言的学习本身就是一个单调而又枯燥的过程,再加上我们面对的又是
作者从高原缺氧、严寒、气燥三方面探讨了高原病中医发病机理。认为急性高原病以气虚、阳虚为主;慢性高原病病因病程较久、五脏俱为所累、属虚实夹杂之证。虚、指肺、肾、心、
目的应用循证护理(EBN),探索糖尿病足有效干预方法,减少致残、致死,提高病人生活质量。方法通过临床评估,确定护理诊断,查阅文献,选择最佳护理证据,制订护理干预措施。结果通
期刊
挤牛奶劳动节这天,二胖主动要求去农户家帮着挤牛奶。于是,农户家的大叔将一个宽板凳和一只桶交给了他。
应激性溃疡又称CuShing溃疡,指在各种应激状态下,胃或十二指肠、食管发生急性黏膜糜烂和溃疡,主要表现为上消化道出血[1],是神经外科常见的并发症之一,病死率高达30%~50%[2].