基于迁移学习的土壤速效磷近红外预测方法研究

来源 :安徽农业大学 | 被引量 : 0次 | 上传用户:ph103
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
土壤速效磷是影响作物生长的重要营养成分,是反映土壤供磷能力和指导磷肥施用的重要指标,快速、准确地检测其含量在作物精准施肥和环境保护方面具有重要意义。土壤速效磷含量的检测通常采用实验室理化检测法,存在检测周期长、过程繁琐以及易污染环境等问题,难以满足现代精准农业发展需求。可见-近红外光谱分析技术具有效率高、操作简单、无污染等优点,结合机器学习方法可以快速、无损地实现土壤速效磷含量检测。迁移学习是机器学习中重要研究问题,它从根本上放宽了传统机器学习的基本假设,在机器学习领域受到了广泛关注。针对土壤速效磷预测模型训练样本和测试样本来自不同地区时,出现的预测精度低、模型失效问题。本研究以皖南黄红壤土样本为源域样本、皖北砂姜黑土样本为目标域样本,以土壤速效磷为研究对象,基于可见-近红外光谱技术,提出利用迁移学习方法处理不同地区土壤光谱数据不同分布问题,构建不同地区土壤速效磷迁移模型。主要研究内容和成果如下:(1)研究了不同光谱预处理和机器学习建模方法对土壤速效磷预测模型的影响。采集源域和目标域样本350-1655nm范围的可见-近红外光谱数据,将原始光谱和预处理后光谱分别结合偏最小二乘回归、支持向量回归和分类回归树算法,构建源域、目标域各自土壤速效磷预测模型。结果表明,选择合适的预处理方法和建模方法可以有效提升模型的预测精度,光谱经Savitzky-Golay卷积平滑再进行标准正态变量变换处理后,结合支持向量回归算法进行校正建模,得到的源域(模型的R~2和RPD分别为0.85和2.59)和目标域(模型的R~2和RPD分别为0.61和1.60)预测模型精度均有效提升。(2)研究了不同地区土壤速效磷预测模型共享的可行性。首先基于源域土壤速效磷预测模型对目标域进行预测;然后构建组合样本作为训练样本,迁移源域土壤速效磷预测模型用于目标域预测。结果表明,基于传统机器学习对训练样本和测试样本独立同分布的假设,源域模型不能直接用于目标域,会出现模型失效问题(模型的R~2和RPD分别为-0.19和0.92);组合样本在使用源域样本的基础上加入了目标域样本,其作为训练样本时,较之前者,模型训练样本和测试样本之间的分布差异减小,缓解了模型失效问题,预测精度有显著提升(模型的R~2和RPD分别为0.54和1.47)。(3)采用迁移学习算法构建了不同地区土壤速效磷迁移模型。针对源域和目标域样本不同分布问题对源域模型共享于目标域可行性的影响,分别使用Two-stage Tr Ada Boost.R2和迁移成分分析(TCA)两种迁移学习算法处理不同分布的源域和目标域光谱数据,并构建土壤速效磷迁移模型。结果表明,在源域和目标域样本分布差异较大情况下,基于特征的TCA迁移算法比基于实例的Two-stage Tr Ada Boost.R2迁移算法有着更好的迁移能力;使用迁移学习算法能够解决源域和目标域样本不同分布问题,实现有效利用源域样本,将源域模型迁移用于目标域,得到的TCA迁移模型R~2和RPD分别为0.79和2.18,提升了对目标域土壤速效磷含量的预测精度。(4)开发了土壤速效磷光谱检测系统。使用Python语言开发了土壤速效磷光谱检测系统,实现了样本数据上传、样本光谱预处理、迁移模型构建以及迁移模型预测四大功能。核心是通过系统内置的迁移学习算法,实现输入少量目标地区土壤样本数据即可获得该地区精度较高的土壤速效磷预测模型,可以降低用户的建模成本和时间。系统为用户提供了便捷、高效的模型构建和样本检测工具,为推广土壤速效磷预测模型的大面积构建提供助力。综上所述,本研究解决了模型训练样本和测试样本来自不同地区时出现的预测精度低、模型失效问题,提高了对皖北土壤速效磷含量预测的准确性。为低成本、高效率构建更多地区的土壤速效磷预测模型提供了理论基础和技术支撑,为推广大面积预测土壤速效磷含量提供了新思路。
其他文献
随着新一轮科技革命深入,我国数字经济飞速发展。近年来,辽宁提出“数字辽宁、智造强省”发展战略,大力发展数字经济,辽宁产业数字化发展不断取得新突破,数字经济在三次产业中的渗透率不断提升,取得了一定的成就。但是在数字产业发展和产业数字化转型过程中,仍然面临了很多问题亟须解决。本文立足辽宁数字经济发展现状,探究数字经济发展面临的问题,并提出对应的对策建议,以期破解辽宁振兴发展难题、推动形成竞争新优势、实
期刊
中国是传统的农业大国,近年来中国的农业进出口总值不断增长,而植物病虫害识别是农业生产中的一个重要问题。人工识别与传统计算视觉的方式很难适应复杂变化的实际应用场景,而卷积神经网络模型能够通过参数优化来适应各类任务,所以需要研究基于卷积神经网络的植物病虫害识别算法。文章基于现有的植物病虫害图像数据,首先使用传统的卷积神经网络模型来对迁移学习方法在植物病虫害细粒度分类任务上的有效性进行了验证;随后使用基
学位
某选矿厂为实现提高产量和回收率的生产目标,达到节约成本、改善工人劳动条件的目的,针对选矿厂的全工艺流程进行了自动化改造,设计了一套选矿自动化控制系统,通过PROFIBUS现场总线远程控制生产现场设备的启动、停止,同时采集生产现场数据,自动调整生产过程中的工艺参数,可使选矿能耗降低,产量与经济效益提高。
期刊
随着互联网技术和信息服务的飞速发展,互联网上充斥着大量的冗余信息,这导致了严重的信息过载问题。由于互联网信息快速、实时、海量地生成,用户越来越难以从海量信息中准确获取与自己兴趣相匹配的内容,因此,研究个性化推荐系统就显得十分必要。早期的推荐系统,仅通过简单的物品销量、话题的点击量或新闻的阅读量等策略对互联网的信息进行排序,然后选取靠前的物品推荐给用户,这与推荐系统用户推荐他们感兴趣的相关项目或服务
学位
体育是发展其他教育项目的基础,体育教育可以为学生培养一个健康的体魄,坚强的意志。因此,各大高校应该注重对学生体育的教育,既有利于培养学生的健康身体,也有利于促进学生的全面发展。下面就针对如何更好地进行体育教学进行探讨。
期刊
最近几年,中国的建筑行业整体面临转型。在此背景下,建筑施工现场管理水准有所提高。但不容忽视的是,在当前的建筑工程项目施工时,依旧存在比较多的问题。因存在上述问题,在一定程度上影响了建筑工程项目管理的施工品质、工程进度以及施工工序。进而导致安全事故发生。这种情况在极大程度上威胁了工作人员的人身安全。在此同时也会对建筑企业造成一定影响。可见,利用有效方式全面提升现场管理工作质量格外重要。结合实际情况,
期刊
当前,工程项目在管理中仍然存在着工程进度缓慢以及效果较差的问题,在施工中也经常发生安全事故,这不仅会对建筑单位经济利益造成重大损害,对建筑单位长久的发展也非常不利。现阶段,不少施工单位已经清醒的认识到了现场管理中所存在的一些不足,并采取相应的措施进行应对和解决,取得了不错的成绩,在某种程度上还提高了工程项目管理的水平。然而由于受到多个方面因素影响,导致现场管理中依然存在着一些问题和不足,基于此,文
会议
基因检测技术的发展和癌症靶向治疗的增加有助于实现肿瘤学领域的精准医学,但目前癌症精准医疗数据的碎片化和异质性给组学数据的临床解释、复杂突变标记物的识别和突变-药物反应预测模型的开发等研究带来了困难。随着数据挖掘技术和人工智能的发展,将这些新技术应用于医学领域,挖掘出数据中有价值的信息才能真正地发挥精准医学前所未有的能力。针对癌症药物敏感性数据的复杂性、多特征性以及多变性特点,一个信息完善且准确的数
学位
竹子生长迅速、纤维细长、纤维素含量丰富,是重要的非木质纤维造纸原料。竹子种类繁多,并非所有竹种都适合造纸,其造纸材性与物理性质、化学性质、纤维形态特征等材性密切相关。目前在造纸竹种筛选中,通常采用物理化学等实验方法测定竹子的物理化学性质和纤维形态等材性指标,借鉴专家学者对竹子造纸材性的评价指标,将实测值与评价值进行比较分析,筛选出优良的造纸竹种。这种人工方法费力、耗时、低效,而且不全面,造成了资源
学位
速效氮是土壤中的重要营养成分,它在土壤中的含量与作物的生长发育质量和最终产量水平息息相关。快速、准确地检测土壤中速效氮含量对测土配方施肥和作物的高产稳产有着关键作用。常见的土壤养分含量测定方法为实验室理化检测法,该方法测定精确,但是存在着低效、成本高和污染环境的缺陷,已无法满足现阶段精准农业的发展要求。近年来,可见-近红外光谱(Visible-Near Infrared Spectroscopy,
学位