基于Flink的实时计算平台的设计与实现

来源 :南昌大学 | 被引量 : 0次 | 上传用户:dxcnet2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着分布式技术的发展,以及各种分布式计算框架在多个领域得到广泛的使用,数据处理模式开始从离线数据处理转向实时数据处理,从而根据数据变化快速做出决策。因此,实时计算系统逐渐成为企业实时数据处理必不可少的工具,对企业未来的发展也有着不可替代的作用。传统实时数据处理模式,是通过使用实时计算框架内部提供的程序调用接口,针对某一特定业务场景编写程序,并通过主动上传程序包的方式将该程序提交到已有的集群资源中。这种数据处理模式有很多弊端,首先编写实时计算程序对开发人员的技能要求比较高,开发人员需要具备一定的分布式计算相关的开发经验,显然在很多传统企业中很少有相关技能人员储备。其次,程序的部署和作业监控很不便捷,开发人员需要主动上传并启动任务,同时通过集群命令跟踪程序的执行情况。因此,本文提出使用Flink实时计算框架构建实时计算平台,从而简化复杂的实时计算任务的开发及繁琐的任务部署、监控。本文主要围绕以下四个方面来展开:第一,扩展Flink实时计算框架功能,并将其作为实时数据处理的底层引擎。Flink提供了 SQL语法可以对实时数据进行DML(data manipulation language)操作,但不支持DDL(data definition language)操作以及和外部维表数据源直接关联的功能。因此,本文基于Flink框架构建的底层引擎支持创建表、创建视图语句,同时使用Flink提供的异步函数实现了实时数据和外部数据源维表进行关联的SQL语法。第二,为部署实时计算任务搭建上层分布式调度系统,用来进行任务提交、跟踪任务的执行状态。调度系统被部署在多个节点,并且支持水平扩展,提交的任务会均匀分配给子节点进行管理,在集群资源充足的情况下进行任务提交,在任务执行过程中会跟踪任务的执行状态,并将运行日志链接返回给上层交互系统。第三,为实时计算任务的创建、任务监控搭建可视化页面,简化用户操作流程。实时计算任务通过页面进行数据源配置,进而方便用户为任务配置数据源信息。同时,可视化页面能够展示任务调度所处的状态信息,任务执行时实时展示内部监控指标以及运行日志信息。第四,对本文设计的实时计算平台进行系统实现,对主要功能模块进行页面截图展示。同时,对系统搭建过程中使用的软件、硬件配置进行说明,并对使用的主要表结构进行字段属性说明。
其他文献
目的:建立参菊洗剂的微生物限度检查方法。方法:采用常规法、培养基稀释法、薄膜过滤法、离心集菌薄膜过滤法对参菊洗剂的微生物限度检查进行试验。结果:参菊洗剂的抑菌作用强,细
江泽民同志最近提出了“三个代表”的重要思想。这从根本上回答了应该建设一个什么样的党、怎样建设党的问题。 从历史的经验和教训春,任何一个党,如果脱离了先进生产力、先进
国家食品药品监管总局16日发布通报称,国家药品不良反应病例报告数据库收到的病例报告显示,口服何首乌及其成方制剂可能有引起肝损伤的风险。据了解,何首乌为常用中药材,分生何首
灌输原理是马克思主义的著名原理,也是指导我国意识形态工作的重要基础理论。因此,全面、准确地理解和把握这个原理就显得十分重要。审视过去,我们在对灌输原理的理解和把握
为贯彻党中央、国务院作出实施人才强国战略的重大决策,落实《国家中长期人才发展规划纲要(2010--2020年)》,中国食文化研究会民族食文化委员会决定从2013年开始,将在全国百个城市
以《温州人在巴黎》《十万人家》为代表的浙商题材电视剧的热播引起了广泛的社会关注。高收视率和“飞天奖”等国家电视剧奖项的摘冠使得越来越多观众开始关注浙商题材电视剧
社会生长点的出现往往带来社会多方面的变化和发展,直至生长出一种新的社会形态。一个社会生长点能否发展起来,不仅要看它是否符合社会的优势需要,还必须具备其存在发展的空间。
现代人普遍具有敏锐的信息意识,这是信息化带来的必然结果.但不可忽视的是,一些人经常被失真的信息所误导,甚至产生心理失衡.从公众利益的角度看,在一般人群中,对于失真或无
建设一支结构优化、分工合理、素质高超的检察队伍,是检察工作的核心和根本。近年来绍兴市S区检察院招录了大量的青年干部,他们接受高等教育,具有扎实的法学理论功底;思维活