【摘 要】
:
随着WEB 2.0,移动互联网和物联网的蓬勃发展等,使现在的数据呈现爆炸性的增长。面向海量数据的大数据平台研究和开发正在成为业界的热点。数据的采集、存储和分析是大数据平
论文部分内容阅读
随着WEB 2.0,移动互联网和物联网的蓬勃发展等,使现在的数据呈现爆炸性的增长。面向海量数据的大数据平台研究和开发正在成为业界的热点。数据的采集、存储和分析是大数据平台的核心问题,其中数据采集主要用以解决多样数据源的接入问题;数据存储主要用于解决数据格式多样性和数据海量存储等问题;而数据分析以提供多样性的算法为目标,为此必须提供易插拔的分析算法引擎。本文基于对主流大数据开源框架的调研、分析和应用,提出了一种基于分布式存储的数据采集和分析平台。该解决方案以统一接口实现数据采集,整合多种存储方式提供数据存储,以插件化的算法引擎提供多样化的数据分析。本文从调研主流开源框架和技术平台入手,分析了分布式系统的技术特点,提出了面向大数据的数据采集和分析平台的功能性以及非功能性需求;接着介绍了本平台的设计迭代过程,对平台架构演进的各个阶段都进行了细致的说明;而后对本平台的实现和测试进行了详细的阐述,给出了功能性和非功能性两方面的测试结果;最后通过介绍了两个具体的应用实例,进一步验证了本平台的有效性。
其他文献
目的:观察心脑合病患者的舌象、脉象特点,以探讨其病因病机。方法 :采用横断面设计,采集心脑合病患者的舌象、脉象信息,并分析其分布特点。结果 :982例心脑合病患者的舌象以
随着经济社会全球化的日益发展,各类危机事件的发生频率也逐步上升,如何进行危机管理成为各国政府以及全社会面临的重要问题,信息管理是危机管理中的重要组成部分,政府对相关
基于非成像光学理论,根据LED光源特性,文中提出一款由两个透镜组合形成的光学系统,其可自由转化光斑形状和大小。从基本的透镜结构出发,利用Solid Works软件,建立有微阵列结
随着时代在不断的发展,茶文化的发展速度在不断增快。人们对于茶的认识也提升,在影视化不断融入我们生活的过程之中,影视艺术传媒鉴赏的形态也在发生着变化。在文化变革方面,
近些年来,流式计算(Computing of Stream)作为大数据领域中一个非常重要的研究内容,在学术界和商业界得到了越来越多的关注。在很多实时流数据查询场景中,对流数据处理的时效
万工显是显微系统类常用光学量仪,文章从影响光学计量仪器精度的直线度系统、垂直度系统等方面,分析影响万工显精度的原因,并采取相应调整措施以达到分析和调整类似仪器的直
信用卡套现在我国的滋生具有深刻而复杂的制度因素和现实根源。近年来,以中国人民银行、银监会为首的相关部委相继发布了一系列规范,2009年底"两高"最新司法解释也将其纳入了
贬谪文人大都具有曲折的人生经历、良好的政治品质、超人的胆识才华、非凡的传世作品,后世文人争相研究,成果颇多。然而,因为过于的热爱、同情,研究者为他们不断贴金,不惜搜
目的研究急诊护理中优质护理服务的应用及临床效果。方法抽取2016年3月至2017年3月于本院接受急诊治疗的200例患者,按照患者入院顺序纳入优质组与常规组(n=100)。优质组实施优
抄袭网站资料引发的纠纷近年来有增多的趋势,法院在面对这类新型争议时,由于没有明确的法律依据,在认定不正当竞争行为时往往陷入困境。我国法院利用反不正当竞争法一般条款