基于Hadoop的分布式预算管理平台系统研究

来源 :中国新通信 | 被引量 : 0次 | 上传用户:DKarson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】    随着企业规模发展,企业的预算管理成为促进企业健康成长的重要基础。现代企业的预算管理涉及各个业务的复杂数据处理,需要能够跟踪预算的执行过程,通过对预算执行数据的监控,实现一定程度的预测,因此对预算管理平台具有较高的要求。传统的预算管理平台功能较为单一,数据处理功能较弱,无法应对日益复杂的企业业务发展。随着大数据技术的发展,Hadoop等分布式平台得到广泛应用。通过Hadoop平台可以存储规模庞大的企业数据,并提供较强的计算能力,同时支持进行数据挖掘,实现预算的预测等,因此本文对基于Hadoop的分布式预算管理平台进行研究。
  【关键词】    分布式    预算管理平台    Hadoop
  一、绪论
  预算管理平台用于支撑企业的日常经营以及企业战略的实现,是现代企业中的重要信息系统。通过预算管理,统一分析企业中的各项数据,跟踪企业各项业务的发展,用于分析企业的资金、财务、业务流程的执行。企业预算管理涉及企业业务发展的各个方面,需要针对企业业务的各项数据进行深入分析,因此需要全面整合企业的各项数据。随着现代企业的发展,各项业务数据逐渐增加,为提供企业制定预算、监控预算执行的科學性,需要预算管理系统提供较为强大的计算能力,在进行预算计划时,能够提供部分预测功能。
  传统的预算管理系统功能主要基于Oracle等传统数据库进行架构,传统数据库在数据存储、存储计算等方面的能力较为有限,对于大规模的数据其计算效率较低,并且难以扩展。同时,对于数据挖掘、机器学习等功能的支撑也较为有限。近年来,以Hadoop为基础的大数据平台得到广泛的应用。Hadoop平台采用分布式架构,能够方便的进行横向扩展,当系统资源无法支撑企业预算功能时,可以通过在集群中增加服务器的方式快速提高系统的性能。同时,由于预算管理的数据一般涉及企业的核心数据,虽然传统的Oracle架构提供了冷备以及热备等方式应对突发故障,但是也很难避免核心数据的丢失。而分布式Hadoop采用分布备份的方式,将核心数据分布在不同的服务器上,其数据安全性得到进一步的保障。同时,分布式Hadoop提供各类机器学习的库,如Mahout等,扩展了系统的学习能力。因此,本文基于Hadoop框架设计企业预算管理平台。
  二、系统需求分析
  预算管理平台涉及对预算的编制与计划、预算的执行管理、预算监督、预算基础数据维护等功能,如图1所示。
  (1)预算编制与计划。预算编制与计划模块提供年度、季度、月度预算以及特殊预算编制等功能。预算编制的基础在于以详实的企业数据为依托,对企业未来发展所需预算进行科学预测,因此需要系统能够提供全面的数据,以及预测功能。
  (2)预算管理。预算管理模块提供对预算的查询、预算预警以及预算的统计功能。对预算的查询需要快速响应,同时对预算执行中可能存在的偏差进行预测以及预警,并提供完善的报表统计功能。
  (3)预算执行。预算执行模块提供预算监控、预算跟踪以及预算执行分析功能。该模块可以跟踪预算的详细执行情况,并分析执行的信息。
  (4)核心数据管理。核心数据管理模块提供对核心数据的入库、核心数据加工以及核心数据的备份与恢复等功能。通过核心数据管理模块汇总企业的各项核心数据,并转化为标准的数据格式提供给系统进行计算。
  三、系统框架设计
  本文基于Hadoop技术栈设计企业预算管理系统。Hadoop基于集群方式管理企业预算管理系统中的各项数据,对企业数据进行大规模存储,同时提供计算能力分析企业预算数据,同时提供机器学习接口,通过对预算管理数据的分析,提供不同尺度的预算的预测以及预算执行过程中的预警功能。本文设计的预算管理系统架构如图2所示。
  基于Hadoop的预算管理系统采用五层架构。首先是基础层,包括Hadoop集群主机、存储以及网络等要素。第二层为ETL层,通过ETL将各业务系统数据采集到Hadoop集群中进行标准计算、数据挖掘等。第三层为存储层,为了方便预算管理系统访问各业务数据,通过ETL工具采集各个业务系统的数据并存储到Hadoop集群。通过ETL汇总的预算基础数据,通过建立数据仓库模型进行管理,在构建数据仓库模型时,基于Hive技术进行实现。其中可以构建贴源的ODS层,主要存储7天左右的业务原始数据。通过对原始数据进行初步计算,得到DWD层,然后进一步为预算管理系统的各个模块提供面向应用的DW层,通过汇总DW层的主题模型形成ST系统模型层。为了能够降低系统内部各个模块的耦合性,本文设计服务层,通过API接口、文件接口、消息机制的方式提供系统服务。系统的最上层为应用层,提供预算管理平台各个业务模块的功能。
  四、系统关键技术
  本节分析预算管理系统实现的关键技术,主要包括Hadoop集群构建、 数据模型实现以及系统服务实现。
  1、Hadoop架构构建
  本文基于Hadoop技术栈搭建预算管理系统,系统集群中包括主节点以及数据节点,其中主节点用于管理与协调各个子节点,数据节点用于存储数据。在计算框架上,选择Map/Reduce框架,该框架将数据任务分布到各个子节点,然后汇总处理各个子节点的计算结果。在Hadoop的调度上,本文采用YARN进行分布式调度,将不同的Job Tracker分布到集群的服务器上。在数据仓库构建上,本文选择Hive作为数据仓库的实现基础平台,Hive对外提供SQL的访问机制。ETL选择Kettle将各个中心的数据进行汇总,如图3所示。
  2、数据模型实现
  在预算管理平台中,基于Hadoop汇总各个业务系统的数据以后,基于Hive构建数据模型,数据模型有利于对预算数据进行标准化,并形成中心主题,然后提供给预算管理系统使用。同时,通过数据模型,也为数据挖掘以及预测奠定数据基础。通过以下形式化过程,构建预算管理的模型,保障数据的一致性。假设∑表示预算管理模型,其中预算规则为C,数据D∈C,r∈R,a,b∈I,则定义如下的模型构建过程:
  (1)包含关系构建,∑├C?D,其中CI?DI。检测所有满足I├∑的的数据模型以及关系。
  (2)数据实例检测,∑├a:C。检测所有满足I├∑的数据模型,是否满足aI?DI。
  (3)数据关系检测,∑├(a,b),检测所有满足I├∑的数据模型,是否满足aI,bI?rI。
  (4)数据概念检测,∑├(a,b,C),检测所有满足I├∑的数据模型,是否满足aI,bI?CI。
  (5)数据模型一致性检测,∑├,检测所有满足├∑的数据模型,是否满足I?CI。
  通过依照以上形式规则,可以构建预算管理系统中的各类数据模型,并且可以通过形式规则保障数据模型的一致性,从而保障模型的安全。
  3、系统服务实现
  本文设计预算管理系统服务如图4所示。API Gateway是微服务系统的对外服务接口,外部系统只有通过网关才能访问系统内部的各项功能。外部应用一般将请求发送给网关,网关进行权限认证等处理以后,会根据请求的不同发送给注册中心。注册中心维护了微服务系统中各种服务的基本信息,只有要注册中心注册的微服务才能被外部系统访问。通过注册中心,将请求发送给具体的微服务模块进行处理。在调用具体的微服务时,一般采用RestFul接口的形式,目前RestFul接口调用对系统消耗的资源最少,调用也最为方便。
  五、总结
  本文基于Hadoop架构设计企业预算管理平台,通过分析预算平台的需求,设计系统的框架,然后详细分析了Hadoop架构的搭建、数据模型的构建以及微服务中心的实现。
  参  考  文  献
  [1]李喜欢. 基于业财一体化的企业PPP业务全面预算管理系统优化[J]. 国际商务财会, 2020(7):17-19.
  [2]石锴. 企业财务管理信息化中智能预算管理系统研究[J]. 办公室业务, 2020,9(1):10-14.
  [3]鲁志芳. 基于Hadoop技术的大数据分析应用系统的研究与设计[J]. 电子设计工程, 2019(16),10:18.
其他文献
5G终端因其具有高速率,低时延,大连接等特点而广受关注,但是因为其技术复杂,工作频段组合多,解决终端干扰已经成为5G终端应用中需要有效解决的一大问题.本文首先分析了 5G终
【摘要】 随着国家科学技术的发展,我国的通信技术越来越强,人们已经发明出来了5G ,这是中国的一项伟大通信史上的成功,也是世界通信史的成功。这项技术的到来,大大提高了移动通信的宽带速度,改变了人类信息社会的水平。并且随着这项技术的到来,人们对于相关的移动通信需求也大大增加。5G技术实现数据业务的多元化,宽带化,智能化与集成化,采用关键的技术,比如内容分发,超密度网等形式去重新建设网络。进一步为人
【摘要】 地铁在城市交通系统中占有重要地位,是现代城市出行的主要方式之一,由于服务的个体较多,且地铁中也有较多的网络型设备需要使用,由此需要对地铁中的网络进行持续升级和优化,在地铁中实现无线网络的全面覆盖,提高地铁服务的质量。本文对地铁无线覆盖的功能需求进行探讨,并阐述了地铁通信系统无线覆盖的基本组成与关键技术,最后从技术功能、稳定性和安全性三个方面提出优化措施。  【关键词】 地铁通信 无
电子通信是现代社会科技发展之下的产物,其已经是人们生活中所必不可少的组成部分,深深的影响着人们的日常生活.电子通信不仅应用到我们的日常工作、生活中,还应用到军事等领
5G技术为通信客户服务模式带来了全新的挑战与机遇,为此,基于5G技术创新通信客户服务模式.通过分析基于5G技术的通信客户服务模式及其演变,明确通信客户服务模式在不同阶段的
【摘要】 针对通信网络资源管理与运营现状,如何做好网络资源的日常管理,提高运营支撑水平,结合目前正在开展的网络资源清查与可视化工作,分析了存在的问题,提出了相应的对策,从分步实施、架构设计和管理制度三个方面展开论述,并对难点问题提出解决建议。对通信网络资源维护管理、运营商数据化转型有借鉴意义。  【关键词】 网络资源 全生命周期 清查与录入  Abstract: in view of th
随着我国经济的发展和技术水平的提升,计算机网络技术已经在各行各业取得了广泛的应用.对于企业而言,视频会议是保证信息化背景下企业决策和运营的关键,但是由于各种因素的影
【摘要】 传输网络是运营商通信网络的基础网络,是业务长久可持续发展的基础保障。网络规划建设应按照面向未来、统筹需求、整体规划、分步实施的原则,坚持网格化、IP化、差异化的规划思路,弥补基础资源短板、优化系统部署、着力提升网络承载能力,推动传输网向大容量,低时延的未来目标网络平滑演进,建立具有发展性、延展性、适应性的传输网络。基于此, 文章从业务需求、网络规划、建设方案等方面分析,指导建立具有发展
【摘要】 随着5G通信技术的不断研发与商用,促使传统行业迎来新的机遇,但是新兴的5G通信技术给社会上一些行业带来冲击。其中对卫星电视节目传输的影响最大,因为5G通信技术规定的频率与卫星电视的C频段相互重合,造成一定程度相互干扰,影响卫星电视节目的传输效率,降低卫星电视行业的市场竞争力。本文探究5G通信技术对温馨电视节目传输的影响,希望提升卫星电视节目传输效率,提升电视节目效果,构建社会和谐发展。
【摘要】 在网络时代发展计算机教育势在必行。而网站作为信息传播的载体,其应用开发不可或缺。本网站系统基于Python语言,该系统支持用户和管理员进行一系列与计算机等级考试相关的操作,基本满足了系统的设计要求。  【关键词】 Python web开发 查询系统  一、引言  1.1课题背景  在科研刚开始时,发展是相对比较慢的,后来人们发明了计算机这种工具,与此同时互联网的快速发展也为整个科