分布式海量数据分析方法研究及可视化系统实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:WarmAir1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代化社会信息程度越来越高,数据量也飞速上涨,大数据时代也随之到来。针对目前产生的海量数据来源复杂、格式多样、存放分散等问题,需要建立一个覆盖主要业务和日常数据,实现数据清洗整合、业务分析挖掘的独立运行的可扩展大数据平台。本文以实验室开展的数据集成及分析平台项目为背景,设计并实现了一个具有多来源渠道、多结构的数据接入能力以及海量数据存储和分析能力的数据集成及分析平台。数据集成及分析平台提供各种数据源的数据的整合服务,将不同格式的数据统一为一致的展现方式,便于全局的管理;再对数据进行深度挖掘,提取具有商业价值的数据并进行高质量数据分析。论文完成的主要研究工作和最终成果包括:(1)数据分析和海量数据测试提供对清洗后的高质量数据提供离线分析服务。具体的研究开发内容包括:设计完成基于Mahout的K-Means算法实现和基于Spark的K-Means算法,并采用三个公开数据集来评估基于Mahout的K-Means算法和基于Spark的K-Means算法性能,对两种分布式平台下的实现算法进行对比分析。在理论论证和模拟环境测试的基础上,需要在实际支撑PB级数据工作的环境中进一步测试,以获得该数量级的测试结果,从而对实际的工程应用更好地指导和改进。选择华为云作为测试环境,采用基于Spark的K-Means算法,形成从100G到16T数据量级的数据分析测试报告。(2)平台实时监控采用企业级的开源软件Zabbix,用于服务器级别的监控。通过平台监控,保证平台数据的安全可靠,且对平台运行提供评估和状态实时监控。(3)数据可视化系统设计与实现对可视化系统进行数据库表设计,完成系统技术架构设计。针对可视化系统需提供的功能针对性的阐述关键功能的设计和代码实现,最后,对完成的可视化系统进行了运行效果的展示。
其他文献
水质预测是保障供水安全性的一项重要工作,通过一定手段对水源地水质未来一段时间的变化趋势加以预测评估,可以较为清楚地掌握水质可能的变化。特别是对于未来水质可能受污染而变差的情况,通过预测分析后能够提前采取相应措施,使水质变化对供水安全性的影响降到最低。由于水体环境非常复杂,各个水质因素之间的影响关系不明确,因此以建模为主要特征的传统水质预测方式普遍存在着操作繁琐、预测精度不高等问题。为了解决这些问题
近年来,智能车辆因其电动化、网联化、无人驾驶化等特点得以迅速发展,并引领智能驱动的未来。智能驾驶作为智能车辆的核心功能,对提升汽车产业竞争力、加快构建智能交通体系、创新用车模式、提升驾驶安全性等方面起着关键作用。然而,基于车载传感系统的环境感知模块是实现智能驾驶的前提条件,影响后续规划和控制任务的可靠性和准确性。因此,对智能驾驶的环境感知技术进行研究具有重要研究意义。本文以智能车辆的环境感知技术作
预制混凝土构件厂的选址,影响到装配式建筑工程的造价、运输设备选择、供水供电条件、原材料供应、运输成本等,在建筑工业化推进过程中受到关注。通过阅读文献发现,目前国外暂无关于PC构件厂选址问题的研究,国内对于PC构件厂选址问题的研究仍处于起步阶段,定性分析的文章居多,定量分析文献不足。本文对预制混凝土构件厂选址采用定性与定量相结合的方法展开研究,对降低运输成本,推动建筑工业化的发展,具有现实意义。在已
建筑工人的冒险行为是导致建筑业事故率高发的一项重要致因,而情绪是导致建筑工人冒险行为的重要个体心理因素之一。建筑领域情绪相关的研究仍较为缺乏,现存的研究也主要采用基于情绪效价划分的方法,探寻积极情绪或消极情绪与行为决策之间的关系,甚至存在研究结论相矛盾的问题。基于情绪的消极偏性以及对建筑工人特殊的高压工作环境的考虑,本文选取了四种基本消极情绪:愤怒、厌恶、恐惧、悲伤,作为自变量,招募43名建筑工人
我国改革开放40年以来,取得了重大的经济成果,农村城镇化速度加快,并且在国家主导下我国的各项基础设施正逐渐日益完善,与此同时也是需要大量的各种建筑材料,尤其是混凝土方面需求是更加庞大,随着改革的加深,这也给资源和环境带来沉重压力,对于现今建设环境友好型、资源节约型社会越来越不适应,因此免蒸养混凝土的出现也是满足社会发展的需求。当今建筑行业中,为了缩短高强混凝土预制制品的生产周期,工厂大都普遍采取使
进入21世纪以来,我国空前的城市建设规模对文化遗产及其周边环境造成了巨大冲击,成为文化遗产保护最为关键的历史阶段。与此同时,在城市规划建设的过程中,大量文化遗产受到忽视,建成的城市公共空间千篇一律,城市的地域文化特征逐渐消失。现今随着城市化进程的加剧以及历史保护意识的不断增强,城市中文化遗产的保护与利用正日益受到人们的重视,国际上的理论研究对象已由文物本体扩大到了遗产周边环境所涵盖的一切历史、文化
人脸图像缺损将大幅降低人脸检测、人脸跟踪、人脸识别等相关算法的性能,给视频监控、身份认证等应用领域带来严峻挑战。人脸修复作为一种利用已知信息修补缺损区域从而获取完整人脸的技术,为上述问题的有效解决提供了可能性。得益于近十年来深度学习的稳健发展,结合了深度神经网络的人脸修复算法获得愈加真实的人脸修复结果。许多研究者利用基于生成对抗网络的人脸修复方法在针对生成高分辨率修复结果、修复任意形状缺失区域等方
预制沟槽式地面辐射供暖系统是一种较为舒适高效的供暖末端,在重庆等夏热冬冷地区应用较为广泛。在实际工程中,建筑围护结构热工设计未考虑地面辐射供暖系统分时分室的间歇运行特征,导致其在应用过程中出现响应慢、能耗大等问题。本文通过理论分析计算及数值模拟,结合重庆地区居住建筑用能模式,对外墙及内墙在采取不同保温方式及主体材料时的室内环境参数、温度响应时间及系统能耗进行计算和分析,研究与地面辐射供暖系统间歇运
教师节的设立,表达的是社会对教师的尊重,期待的是教师能为社会更好地育人。可是,教师社会地位的真正确立,却需要教师自身持续而自觉的自我改造,才能持续保持具有与时俱进的为师之道、为师之能。滚滚时代,奔涌向前!跨入新时代的高速车道以来,教师受到了越来越严峻的挑战,成为岌岌可危的职业。
期刊
随着汽车智能化的发展,自动驾驶车辆近几年出现在人们视野中,自动驾驶技术的发展能给人们生活带来便利的同时也会减少交通事故的发生。智能汽车的环境感知技术作为自动驾驶系统中至关重要的一部分,无疑成为目前国内外学者研究的重点,研究如何利用传感器更加精确地获取道路场景的环境信息具有重要的意义。基于以上认知,本文研究基于摄像头和激光雷达在道路场景中的动态目标检测、识别,为自动驾驶汽车提供充分的环境信息。首先,