面向农业气象应用的Spark系统任务调度与shuffle过程优化

来源 :湖南农业大学 | 被引量 : 0次 | 上传用户:stefanie456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着农业信息技术的发展,如何利用气象数据抵御农业气象灾害已成为农业领域研究的热点。由于气象数据处理计算量大、种类繁多等特征,使得大数据计算技术如Spark成为分析气象灾害对农业影响的主流手段。但Spark内存计算技术在处理诸如农业气象灾害预报时依然存在本身固有调度策略调度性能低和shuffle过程数据倾斜影响性能问题。针对Spark调度策略的局限性,本文提出一种基于模拟退火算法的Im SA调度策略。主要思想是模拟退火算法参数与Spark中调度目标Task结合,充分利用集群和Spark性能对任务队列初始解进行优化;同时将退火过程与变邻域搜索算法结合起来的方法生成初始和退火任务队列,使用模拟调度池和Metropolis准则进行选取,创建一系列模块融合实现改进模拟退火调度算法。其次,针对shuffle过程数据倾斜问题本文采用蓄水池抽样算法给出抽样分区方案,先对Map任务的中间数据进行采样,通过数据倾斜检测模型获得Key分布直方图,然后在Reduce过程中对Key进行二次分区,将采样过程中频率最高key进行负载限定。实验首先在Spark集群上使用Im SA调度策略和FIFO策略对日照百分率进行统计,并将得到统计结果时间进行对比,说明了Im SA策略在执行海量农业气象数据分析时的优越性;其次,采用二次分区策略和Range Partitioner策略对NOAA中庞大数据集进行雨量大小划分,使其处于Key倾斜情况,实验表明二次分区策略能够有效减少shuffle时间。
其他文献
无人机图像作为一种现代化、多元化、高效化的遥感技术,能够监测农业农作物生长情况,为农作物提供一个良好的生长环境。近年来,无人机图像遥感技术不断实现新突破,广泛应用在农业生产和科技创新等领域,利用无人机图像遥感技术能够为农作物的生长管理提供较为准确的数据支撑和决策依据,成为农业现代化进程中的有效手段。本研究以同时期不同拍摄高度的11个品种的甘蓝型油菜为研究对象,利用无人机搭载高清摄像头获取甘蓝型油菜
学位
随着人们对水产品需求的不断提升,集约化水产养殖产业凭借其先进、高效等优势获得蓬勃发展。然而,集约化养殖的高密度容易导致水质恶化,养殖水质的科学管理已成为制约其发展的主要瓶颈。考虑到养殖水温是影响水产品产量与质量最为重要的水质参数,而现有水温预测模型在水产养殖领域的应用尚浅,养殖人员多依据养殖经验对养殖水温进行管理与控制,出错率高且效率低下,本研究围绕池塘养殖水温预警提出一套完整解决方案,即基于改进
学位
叶绿素作为高等绿色植株的重要生理色素,其对绿色植物的作用也不言而喻,在绿色植物所依赖的光合作用过程中叶绿素是不可或缺的基础。现阶段的叶绿素含量测定的方案较多,基于计算机视觉方向的叶绿素测定也有很多学者在研究。但是,大部分基于计算机视觉的研究中对于视觉设备的要求较高,同时,由于其固定的设计软件运行环境等因素,使得基于计算机视觉的叶绿素含量识别研究存在一定的局限性,本文主要选择移动设备作为计算机视觉的
学位
发展社会工作是党中央对社会建设领域做出的重要决策部署,也是民政部门的一项重要职责。而加强社会工作服务机构内部控制建设,是落实这一决策部署的重要前提。由于社会工作服务机构大部分为民间非营利组织,因其非营利、规模小的特点,对内部控制建设并不重视。文章围绕民间非营利组织的定义、内部控制的含义以及重要性,逐一对其在内部控制方面出现的问题,如民间非营利组织会计对风险评估程序缺乏重视,内部控制意识薄弱,内部控
期刊
知识图谱是谷歌首先使用在自家搜索引擎中,旨在实现大规模搜索个性化推荐的一项伟大的发明,除此之外,在文本语义理解和知识问答对话问题上也能起到很好的辅助作用。中国农业科学叙词表是诸多农业领域专家共同编写的农业领域百科辞典,适合以它为基础构建农业知识图谱,但这样构建的农业知识图谱只有农作物实体和基本的用、代、属、分、参等关系,并不包含农作物属性。为进一步完善农业知识图谱,需要将农作物属性补充进去。鉴于人
学位
农业病虫害防治是保证农业生产有序开展必不可少的工作。作为中国主要经济作物之一的烟草同样面临着虫害频发带来的挑战。传统化学农药防治因其环境污染、抗药性以及农药残留等问题与可持续农业发展理念背道而驰。因此,发展准确的烟草虫害预测方法,对虫害发生提早预警,可为综合防治方案制定提供指导,减少化学农药施用,提高烟草产量与质量,对发展农业虫害绿色防治方法意义重大。烟草虫害多代为害的特点使得其发生既受气象因子、
学位
推动思想政治理论课精准教学是落实精准思政的内在要求,同时也对提升学生获得感,巩固我国主流意识形态主导地位具有重要意义。人工智能技术三大基石及其技术特性是助推思想政治理论课精准教学的内在依据,而国家对人工智能产业发展的政策支持以及高效智慧校园搭建形成的良好技术环境又为思想政治理论课精准教学提供了良好的外部条件。思想政治理论课精准教学的实施以精准定位目标、精准分析学情、精准供给内容、精准跟踪学习、精准
期刊
学位
学位
随着人口老年化的加剧,农村劳动力短缺的现象日益严重,人工成本的增加越来越不适应苹果的规模化生产。人工智能,物联网,大数据等新技术的发展有助于改变劳动力短缺现象,因此,智能生产已成为现代苹果生产的必然趋势。在苹果的采收过程中,使用苹果自动采摘技术可有效地降低苹果采摘过程中劳动力的投入。然而苹果自动采摘技术的关键问题是如何在自然环境下对苹果果实的检测和定位,本文研究了基于数据增强和Transforme
学位