【摘 要】
:
目前,很多互联网公司需要对数据信息进行实时计算处理,其中包括实时的风控管理,实时的舆情监控,实时的个性化推荐等,这些应用的数据多数来自系统产生的日志信息,因此日志信息
论文部分内容阅读
目前,很多互联网公司需要对数据信息进行实时计算处理,其中包括实时的风控管理,实时的舆情监控,实时的个性化推荐等,这些应用的数据多数来自系统产生的日志信息,因此日志信息的处理对公司业务十分重要。根据企业对日志实时处理的要求,本文设计并实现了一个基于Storm日志实时分析存储的系统。本文介绍了日志实时分析的研究意义,开发过程中涉及到的相关技术,设计了系统的整体架构和功能模块。本文的重点主要是实时日志分析的后端架构。架构中,使用分布式的Flume组件来监控多个不同日志文件,日志信息通过Memory Channel发送到Kafka的Sink上。在日志的收集模块和处理模块之间使用Kafka作为中间件,实现流量削峰和业务模块的解耦。在实时处理的模块中采用Storm技术,Storm的Spout组件读取Kafka上的数据,并通过Bolt节点实现对模块的分析和处理。Spout把读取的数据封装成Tuple数据发送给下游的Bolt节点,系统根据创建的Topology进行流数据的处理,并把处理过后的数据向上游节点发送确认,保证数据的正确处理。Storm实时分析数据,最后要把分析的数据持久化,本系统使用HBase作为数据的持久化存储,HBase具有易扩容高性能的特点,同时HBase表的结构可以动态的改变。本文实现了实时日志处理的服务端系统,能够读取不同数据源的日志数据,实现日志实时计算,分析,存储的功能,提供了一个分布式的,稳定的,可扩展的海量日志实时分析处理存储的系统。
其他文献
随着科技的飞速发展,视频监控技术也随之成熟,而人形识别技术是现代视频监控系统的核心技术之一。人形识别对智能视频监控技术具有十分重要的理论价值和应用意义,人们丌始日
VME(VersaModuleEurocard)总线是一种通用的计算机总线,它定义了一个在紧密耦合(closelycoupled)硬件构架中可进行互连数据处理、数据存储和连接外围控制器件的开放式架构。由于其
目标跟踪具备重要的科研价值,且被普遍应用于视频监控、智能交通等之中,近年来一直都是机器视觉研究当中的热点问题。针对目标跟踪问题,当下已提出众多研究算法。虽然这些跟
目前国内大部分园林管理部门已建立了园林信息管理系统,并积累了大量的管理信息数据,但能够提供有限的关于管理决策的全局信息却非常缺乏。在开源节流成为各级单位管理主题的情
在无线通信技术不断发展的今天,群体机器人技术的研究成果也突飞猛进,这两者之间的有机融合引起了相关学者的广泛关注,群体机器人的功用体现在生活的方方面面,多应用在条件较为复
在自然界、人类社会和数据集等领域中,存在着许多不平凡的时间或对象,这些不寻常的事件或对象具有非凡的重要性,有可能导致发现新的信息和知识。这些颇有价值的信息和知识没
随着Internet的普及和多媒体技术的发展,数字产品的产权保护已经越来越重要。数字水印技术是通过一定的算法将产品的版权标志性信息等水印信息直接嵌入到多媒体数据当中。数
在信息系统的日常应用中,信息安全已经成为亟待解决的问题之一,而作为信息安全技术的重要组成部分的访问控制技术,也成为研究的热点。传统的访问控制技术分为自主访问控制技
无线传感器网络是一种多跳自组织网络,它由大量能量有限的传感器节点组成,监测传感器附近的信息,并把经过处理后的数据传给用户。为了节省整个网络的能量、增强收集到的数据的准
在计算机技术的不断发展下以及信息技术应用的逐渐普及,以计算机信息系统为载体的智能教学系统(Intelligent Tutoring System,ITS)在现代信息化教育里,扮演着越来越重要的角