【摘 要】
:
随着互联网的日益普及和信息技术的飞速发展,互联网产生的数据正在爆炸式地增长,海量信息的存储与处理已经成为了每个企业必须重视的问题。当前,Hadoop是一种主流的开源大数
论文部分内容阅读
随着互联网的日益普及和信息技术的飞速发展,互联网产生的数据正在爆炸式地增长,海量信息的存储与处理已经成为了每个企业必须重视的问题。当前,Hadoop是一种主流的开源大数据分布式平台,它的分布式文件系统(HDFS)可以完成PB级别的数据存储,其原生的MapReduce编程模型可以完成大规模数据的离线处理。然而,MapReduce计算框架运算时会多次读写磁盘,导致延时大,作业成本增加,并不适合DAG运算、迭代运算等场景。对于在线/近线系统来说,处理在线系统产生的流式数据,需要低延时高可靠的处理技术,Mapreduce编程模型也无法满足实时监控与统计分析的需求。与此同时,基于大数据的新业务模式还将不断涌现,Hadoop的应用也会从互联网领域向金融、生物制药、电子商务等多领域拓展,大数据开发平台需要在更多没有Hadoop专业知识的用户中推广。而目前的大数据分布式系统大都是为专门的数据分析人员设计的,对数据处理、算法计算结果仅支持直接查询HDFS、数据库等,并没有简洁易懂的操作界面以及可视化模块,没有太多数据分析经验的人员很难通过简单的浏览文件系统中的数据,对数据处理结果有一个宏观的把握。针对以上问题,本文设计并实现了基于Eole系统的数据处理与数据可视化的处理平台。该平台采用B/S架构,底层基于Hadoop平台,采用Spark内存计算框架及其Spark Streaming组件作为数据处理框架,实现了高效的离线计算和实时计算的功能;使用HBase NoSql数据库作为主要的存储方式,保证了系统在高并发的状况下仍然能够提供稳定的服务;同时,使用ECharts图表绘制工具,实现了运算结果的可视化展示。用户通过在浏览器端的操作,即可完成数据管理、数据处理与计算和图形化展示功能,极大地提高了用户工作效率。
其他文献
在软件工程领域中,随着用户需求增大,软件规模不断扩大并且其复杂性正在逐步增加。程序切片作为一种程序分解技术,可以有效地把一个复杂的程序分割成多个部分,使得该程序便于
无线传感器网络网络配置灵活,能够形成一个多跳自组织网络。无线传感器网络一般多部署在复杂无人值守的环境中,其开放性和无线通信的广播特性都给网络安全带来了极大的隐患。
住宅是城市最基本组成部分,因此城市住宅演变研究对厘清城市空间发展脉络有重要意义。里弄住宅是中国近代最重要城市住宅类型之一,其原型是中国传统合院式住宅与西方联排式住宅,但其中的形态传承关系却不甚明了。由此本文以天津传统合院式住宅和旧式里弄两类住宅为例,旨在通过形态学分析厘清二者间的形态演变及传承关系。研究采用意大利类型过程学方法,将传统合院和旧式里弄纳入连续的类型过程,并通过不同层级要素解读住宅形态
水位改正是水深测量中一项重要的工作,其目的是获得待求点在测深时刻的真实海面位置,并将其归算至指定深度基准面上。现阶段,测深仪器和手段已有了较大突破,以多波束系统为代表的高分辨率、高精度测深方法在工程中得以广泛应用,而水位改正仍旧停留在传统方法上,成为了制约测深精度的主要因素之一。本文针对传统水位改正方法存在的问题进行了深入分析,并使用区域精密潮汐模型和余水位结合的方法实现了近岸复杂海域的水位改正。
SIP协议因其灵活性和易于扩充,被广泛应用于NGN、IMS等网络中。但由于SIP协议基于文本的特性,导致SIP消息容易被黑客改造成畸形SIP消息威胁核心网,从而引发网络实体崩溃、服
电子文档的随意拷贝和任意传输容易导致信息的泄露、窃取等问题,尤其是机构组织内部人员产生的泄密行为造成的后果往往更加严重,同时也最难预防。对于企业内部信息的安全保护
随着大数据技术的发展,信息系统成为管理业务过程的重要工具。过程挖掘技术能够从信息系统产生的事件日志中提取知识,进行过程发现、一致性检测和过程增强。过程发现基于事件日志中包含的信息来构建过程模型,一致性检测用于分析过程模型与事件日志之间是否存在偏差,过程增强利用事件日志对现有的模型进行扩展或改进。模型修复技术作为过程增强的一种应用,能够根据事件日志对过程模型进行修复,使修复后的模型更符合实际的业务过
作为一种域间路由选择协议,边界网关协议BGP的功能成熟可靠。但是,BGP协议在安全方面却存在设计缺陷,面临着各种各样的威胁。当前,对BGP协议安全性增强的研究主要集中在域间