【摘 要】
:
大数据的产生推动了科技的发展,使得财务系统的有了新的契机,同时也使得应用系统在数据存储和分析方面有了更高的要求,所以研究大数据相关存储及分析处理技术刻不容缓,在此背
论文部分内容阅读
大数据的产生推动了科技的发展,使得财务系统的有了新的契机,同时也使得应用系统在数据存储和分析方面有了更高的要求,所以研究大数据相关存储及分析处理技术刻不容缓,在此背景下,逐步出现了Hadoop、Spark等大数据技术。本文主要研究如何将Saprk等大数据技术融入到传统的企业财务管理系统,最终构建出面向用户、面向管理、面向分析的新型财务管理类系统,解决当前企业财务数据冗余杂乱、数量多源采集、数据共享能力差、数据查询缓慢、分析困难等多个问题。此外,本文建设的基于Spark技术的经济动态管理系统大数据处理模块中大表连接查询的操作较为频繁,而在Spark中,由于大量不符合连接条件的数据进入了Shuffle阶段,导致频繁的I/O操作,使得Join操作性能较低,所以本文将针对Spark大表间等值连接的进行研究与优化。本文具体的研究路线分为三步,首先依托已经成熟的Spring MVC框架以及Web相关技术构建经济动态管理系统,完成传统的、数据量较小的关系型数据的处理分析需求。之后,加入Hadoop、Spark等大数据技术,完成经济动态管理系统中批量数据处理以及实时数据分析的需求。最后,提出一种利用BloomFilter预先过滤大部分不符合连接条件的数据以降低进入到Shuffle阶段的数据的方式来优化Spark自带的Join算子,提升连接效率。
其他文献
在分析九江车务段所辖站段信息化应用现状的基础上,针对铁路系统对办公自动化的强烈需求,构建了基于网络的车务段办公自动化系统的体系结构和功能结构,在其所辖站段开展应用,
为加强铁路局大修预算管理,发挥信息系统在铁路大修预算管理中的作用,分析了铁路局大修预算管理业务流程,并依据铁路大修相关规程,采用开源数据库Postgre SQL+Post GIS、开源G
为了更好地提升初中物理教学水平,需要充分发挥微课的作用,基于此,文章阐述了微课的概念及特点,分析了微课在初中物理教学中的应用,即合理确定微课主题,科学设计微课,微课的
为了确保双机热备平台满足相应的功能需求,需要对其进行功能测试。采用基于模型的测试方法,可以有效地避免人工手动生成测试中存在的不足,提高测试效率。利用Event-B方法对双
铁路货运电子商务系统是一项重要的信息系统建设项目,将从工程的视角对系统进行解析,内容包括对项目的意义、风险以及其他相关问题进行阐述,并有针对性地提出建设意见,以期保
<正> 目前出版的不少图书,封面多有前后勒口,使读者拿到一本新书在翻阅时,首先会产生一种庄重厚实的感觉。这种设计方法所费材料有限,而好处不少。一般是利用前后勒口提供该
本文在人工处理职工诉求的基础上,从服务职工的角度出发,结合信息化管理的特点,提出了广铁集团服务职工网络系统的设计方案,详细介绍了系统的总体架构和主要功能模块.目前该
客票系统核心数据库是整个客票系统高效、稳定、安全运行的关键.本文分析客票系统运行中Sybase数据库可能出现的问题及产生原因,详细论述保障数据库健康运行的“在线”数据库