基于Spark的分布式大数据分析算法研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:yongtso88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据计算的实时性和数据量面临许多挑战。为了满足庞大的数据量和大数据高速处理的要求,研究将Apache作为一种集成的资源管理系统。采用Apache Storm、Apache Spice及SARK RDD处理大型分布式实时数据流,使用Apache Kafka作为消息中间件来支持异步消息的通信。设计一种支持并行运算规则的分布式大数据分析处理算法。实验结果表明:该算法可有效降低海量数据的分析速度,且支持系统内各子系统间的异构信息沟通与数据存储,足以满足高频交易市场的短期趋势预测需求。在高频、大数据处理系统中具有较高的应用价值。
其他文献
牛眼虫病是牛的一种寄生虫病,主要因吸吮线虫寄生于牛结膜囊、第三眼睑和泪管引起的。此病在我国各地普遍流行,对牛的危害很大,可引起结膜炎和角膜炎,甚至角膜糜烂和溃疡,病
混凝土灌注桩技术因其承载力能力高、施工方便、工期短、造价低、所需设备少等优点,岩土工程中得到了广泛的应用.文章就混凝土灌注桩技术的应用展开分析和研究.
目的利用非线性混合效应模型(NONMEM)法建立伏立康唑的群体药物代谢动力学(Pop PK)模型,探索影响伏立康唑体内处置的生理病理因素,为伏立康唑的临床个体化用药提供依据。方法
从全国范围内收集贞节牌坊296座,对之进行统计分析发现:南方地区的数量远远大于北方,尤其是以安徽为首的华东地区和以四川为中心的西南地区为最多;吴越文化区、闽南文化区和
<正>质量工作总体要求:认真学习贯彻集团公司第五次工作会和型号工作会会议精神,以确保型号研制生产试验任务圆满完成和提升质量管理能力为目标,以深入推进精细化质量管理为
马驽巴贝斯虫病由驽巴贝斯虫(Babesiaca—balli)经媒介蜱传播寄生于马属动物红细胞内引起的一种血液原虫病,我国将其列为二类动物疫病。其病原为驽巴贝斯虫,传播媒介为森林革蜱(De
自2010年秋以来,我国华南、华东和华北部分省份出现了严重的生猪腹泻流行,造成仔猪的死亡率急剧增加。2011年年底,生猪腹泻卷土重来,给养猪业带来了不可估量的损失,笔者通过临床所
目的利用光纤药物溶出仪对溶出、取样和测定全程测试的实时、原位特点,测定头孢克洛片和胶囊的实时溶出度,评价药品制剂工艺和内在品质的差异。方法实时在线过程分析同一厂家