【摘 要】
:
随着互联网和信息技术的发展,企业中信息系统的规模迅速扩大,各个系统之间数据传输的复杂度也随着系统数量的增加而变得异常混乱,这就可能造成“信息孤岛”的问题从而无法实
论文部分内容阅读
随着互联网和信息技术的发展,企业中信息系统的规模迅速扩大,各个系统之间数据传输的复杂度也随着系统数量的增加而变得异常混乱,这就可能造成“信息孤岛”的问题从而无法实现数据共享。本文通过研究当前的ETL技术,利用Kafka消息系统、Hadoop分布式系统架构、多源数据库等技术,结合Kafka Connect设计并实现一个流数据处理分析系统。系统支持数据的抽取、聚合和分发,实现了大量数据进出Kafka消息系统从而和其他数据源进行交互共享。本文主要介绍了基于Zookeeper框架实现对集群、Broker和Topic的管理;利用Kafka Connect构建不同的源(source)/目标(sink)连接器,在Kafka消息中间件的上游和下游形成一个无缝连接的数据流通道,实现了不同数据源中的数据的交互共享。同时也介绍了基于JMX实现对集群的监控,包括对Broker、Topic和连接器的实时状态监控、流量监控和实时的异常信息预警等;以及基于Filebeat和Logstash实现对日志文件的收集和输出以便对日志内容的查询和查看。最后,本文还搭建实验环境测试了系统的性能,通过结果分析本系统能够完成从异构数据源(Oracle、MySQL等生产者)抽取数据到Kafka消息系统进行缓存,并输出到消费者端进行处理。
其他文献
采用95%乙醇加热回流提取唐古特白刺(Nitraria tangutorum Bohr.)果实成分,依次用石油醚、氯仿、乙酸乙酯和正丁醇进行萃取。用DPPH自由基法和ABTS+·法进行抗氧化活性实验,
2013年1月29日,住房城乡建设部公布首批国家智慧城市试点名单,这说明,我国政府已开始逐渐关注并开始"智慧城市"的建设。而这首批试点城市的建设情况至关重要,关系到未来我国
目的 通过对呼和浩特市劳教所、戒毒所吸毒人员艾滋病、梅毒及丙肝感染状况的分析,了解吸毒人群经血液、性传播疾病的危险因素,为开展干预工作、预防控制相关疾病在该类人群
Phonics和音标教学法各有所长。根据两者特点,在学习的初级阶段有效地学习Phonics,然后再系统地学习音标才能有效地融合他们的优势,弥补各自的不足,达到最佳的教学效果。此外
鼓风机是曝气处理工艺污水处理厂中的关键设备。该文结合工程实例,介绍了空气悬浮鼓风机在污水处理厂中的应用前景。
针对物流企业客户信用评价进行了研究,基于模糊综合法构建了以企业信誉及违约记录、速动比率及资产负债率、人力资源水平及盈利能力、产权清晰程度及担保状况、区域信用状况
目的探讨经尿道前列腺电切术后出血的原因及预防措施。方法回顾分析2002年1月至2011年5月本院74例经尿道前列腺电切术后大出血的临床资料。结果其中43例经保守治疗有效,31例
目的通过实证分析不同渠道医院呼吸系统用药相关数据,了解中国呼吸系统疾病药物利用现状。方法从中国三个医药市场数据库(CHIS数据库、PDB数据库和MENET数据库)获取医院呼吸
一、会计信息及其重要性 会计信息是一种经济信息,它主要用货币来表示,以表明企业在一定的时点上或一定时期内资本运动的状况和经营成果。会计信息是一个特定主体的经济信息
<正>工程项目是施工企业管理的根基和效益的源泉。企业的生存以项目做支撑,凭借效益才稳步。在当今建筑市场走向透明,工程项目在竞争中趋于微利甚至无利的形势下,我们要守住"