基于大数据平台的内蒙古地闪时空分布特征分析研究

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:PDH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
雷电对人们的日常生活有着严重的威胁,对雷电进行时空规律分析,以及对雷暴进行更高精度的预报具有重要的现实意义。随着互联网的高速发展和气象监测水平的不断提高,产生了海量的雷电资料数据。在对雷电资料数据进行分析或预报等业务时,需要进行大量繁复的运算,而大规模运算存在耗时较长的问题,传统的单机方式已经越来越难以满足海量雷电资料的存储与处理。如何更好的对海量雷电资料数据进行挖掘研究成为气象部门工作的研究热点。大数据技术的出现,为海量雷电资料的处理提供了一个新的思路。课题针对内蒙古地闪时空分布特征分析研究,主要研究内容包括雷电时空规律分析和雷暴预报应用研究。雷电时空规律分析主要采用Spark算子和K-means算法对地闪定位资料分析;雷暴预报主要采用朴素贝叶斯算法,进一步对雷电时空规律分析,目的是对未来某一区域某一时段是否发生雷暴做出预测,主要工作如下。1.基于Hadoop+Spark平台设计了雷电高发区域划分算法SCK-means和雷电时间规律STime算法。针对K-means算法随机选取初始聚类中心和K值的问题,采用Canopy对K-means算法进行优化,并将优化的算法基于Spark平台进行并行化设计,形成了雷电高发区域划分算法SCK-means。利用Spark算子设计了雷电时间分布规律算法STime。最后,采用SSE、加速比和扩展比作为评价指标,实验结果表明本文设计的时空规律算法可以准确快速的挖掘雷电规律,为防雷减灾提供决策支持。2.基于Hadoop+Spark平台设计了SPNBC雷暴预报模型。针对传统朴素贝叶斯分类模型(NBC)的独立性假设问题,采用PCA算法优化贝叶斯分类器构建PNBC;并将优化后的算法基于Spark平台进行并行化设计,形成了雷暴预报模型SPNBC。最后,采用准确率、空报率、加速比和扩展比作为评价指标,与常用的BP神经网络和传统朴素贝叶斯雷暴预报方法进行实验对比,实验结果表明本文所提出的雷暴预报模型具有较佳的准确率和空报率,而且在处理海量数据时有较大的性能优势。论文通过对雷电时空规律分析、雷暴预报领域的研究,设计了基于Hadoop平台的雷电资料的存储方案、基于Spark平台的雷电时间与空间规律挖掘算法和雷暴预报模型,并通过实验验证了本文提出的算法和模型有效提高了雷电数据挖掘的效率和雷暴预报的可靠性。利用本文的研究成果可以构建快速的雷电数据分析平台,为气象相关人员快速分析雷电地闪过程的强弱和走向趋势提供良好的服务,为气象数据进一步的应用奠定了基础。
其他文献
随着无线通信技术的发展和车载电子终端的普及,使得人们可以通过构建人-车-路协同的车辆自组网(VANET)来提供便捷准确的交通信息服务,如何通过车辆动态信息挖掘,提供实时导航、交通出行规划是其中一项重要应用,也受到了政府、学术界和工业界的广泛关注。本文将出租车上GPS视为移动传感器网络中的移动节点,基于城市出租车GPS数据挖掘,对交通状态进行实时感知,同时对出租车的需求进行实时预测,可以为车辆路径规
高硅铝合金因比重小、强度高、热膨胀系数低和耐磨性能好等优点在汽车、电子封装和航空航天等领域具有广阔的应用前景。其优异的性能主要取决于合金组织中Si相的大小、形貌和分布状态。本文针对高硅铝合金Si相细化存在的难题,以A120Si4Cu合金为目标成分,采用了快速冷却、变质、热处理和轧制等工艺方法改善合金组织形貌。配合OM、SEM、EDS、XRD等主要测试手段,研究了不同制备工艺对A120Si4Cu合金
目的:初步探究盐酸千金藤碱(Cepharanthine hydrochloride,CH)对人牙髓干细胞(DPSCs)增殖和成骨分化能力的影响。方法:收集健康成人无牙体牙周等疾病的阻生齿,体外组织块法分
近些年,不法分子利用便利的交通运输违禁品,严重的破坏社会的和平与稳定,为此,世界各国相关的研究机构和企业开展了于此相关的安检设备研发工作,并取得了大量成果。其中,毫米
量子密钥分发是量子信息中发展比较快、实用化程度比较高的量子技术,理论上具备无条件的安全性。量子密码系统的安全性还依赖相关系统器件的精度,但实际中使用的器件并不总是
本文主要研究期权定价问题。随着金融衍生品市场在世界范围内的飞速发展,期权作为金融衍生品的重要组成部分,对其性质的研究也越来越广泛、深入。目前其研究内容大致可分为两
颗粒增强铝基复合材料(PAMC)具有高比强度、高比刚度、高耐磨性、良好的热稳定性等优良性能,拥有广泛的应用前景。添加纳米级SiC_p,不仅可以类似微米级SiC_p增强AMCs提高硬度、耐磨性,同时还可以避免降低延性或抗拉强度,因此纳米SiC_p/AMCs复合材料(NPAMCs)应用潜力和价值十分巨大。然而,纳米SiC_p由于高比表面积、与铝合金熔体润湿性差造成易团聚、不易在熔体中分散的问题影响了复
在森林资源调查中,立木高度的测定至关重要,直接影响林分的蓄积量以及森林生物量提取的准确性。本文针对现有的立木高度测量方法中存在的测量效率不高、测量准确度不高及测量
湿式离合器是机械传动系统的关键组成部件,其通过对配对摩擦副接合和分离的有效控制,实现重型车辆或传动装置的良好协调匹配。但在湿式离合器的工作过程中,离合器的主、被动端在速差及摩擦力的作用下产生了大量摩擦热。同时,目前机械传动的发展趋势为小型化、轻量化,这使得车辆传动系统功率密度和转速的不断提高,引起实际工况下,离合器在工作过程中常出现摩擦副烧蚀、变形和严重磨损的现象,甚至烧结为一体。本文以湿式离合器
随着现代工业的发展,内高压成形技术逐渐成为主流加工技术,对于内高压成形机而言,其液压缸位置的准确控制是零件成形的关键。分数阶微积分是整数阶微积分的扩展,具有历史记忆性和全局性。与整数阶模型相比,分数阶模型能更加准确地描述系统的动态行为。因为分数阶微积分在控制上的巨大优势,可以将其用来对内高压成形机的液压缸位置系统建模来改善其控制。本文针对内高压成形机,对其液压缸位置系统进行了分数阶建模,设计了分数