论文部分内容阅读
随着新一代信息技术的飞速发展,越来越多的新名词被跨界叠加到古老而又充满活力的农业中。在大数据、物联网、人工智能、5G以及区块链等技术的加持下,特别是一批信息技术巨头公司的介入,以解决供销关系(含溯源)、土壤墒情(无人机、遥感等)、大田作物管控(无人机、视觉识别、AI作物模型等)为主的智慧农业技术与平台,如雨后春笋般遍布中华大地。设施园艺技术,常被作为产业链平台中的子系统规划到智慧农业甚至智慧城市的项目中。实际上,作为生产端的设施园艺数字化技术远比大众认为的基于传感器的IO管控系统要高级复杂的多,完全可以作为独立的系统与产业链的各个环节交互融合,根据外部需求调整内部的过程管控。文章着重于新一代信息技术在设施园艺技术中的发展与应用,阐述了数字园艺的发展阶段,大数据与人工智能等信息技术的应用(产量预测模型),并提出了有关人工智能以及模型与未来无人运营温室(Autonomous Greenhouse)的思考。
数据利用的发展阶段
园艺技能精湛的人通常被称为“绿手指”。荷兰人凭借其天生的忧患意识和贸易天分,将荷兰的设施园艺技术开发到极致并积极推广到全世界,是各国多年来一直学习和模仿的“绿手指”。荷兰种植者感知植物状态的能力,像极了中国大厨行云流水般颠勺翻炒,总是带着“加盐少许”般难以量化的神秘感觉。所谓的直觉和感觉,就是国内种植者要学习和消化的核心技能。而数据则是破译秘籍的钥匙。
生活在被数据包围的时代,大众对数据的力量深信不疑,也在以前所未有的速度创造和收集数据,世界上90%的数据都是在过去两年时间里收集的。先进的温室每天创造数据大约7500条/hm2,随着传感器技术以及智能设备的发展,这个数值还在持续不断地上升。面对庞大的数据,如何提取有价值的信息是值得大家关注的。有明确目标和宗旨的数据分析是为种植者提供有决策支持信息的重要手段。数据分析有4种类型,也代表人类对数据价值发掘利用的4个阶段:描述性分析、诊断性分析、预测性分析以及规范性分析。他们分别对应的问题和目标是“发生了什么?” “为什么发生这种情况?”“什么将要发生?”以及“什么是最有可能发生的?”(图1)。越高级的阶段,所需要涵盖的算法和模型就越复杂,所具有的商业价值也就越高。
关于数字农业分类的观点很多,一些观点甚至带着信息技术尝试 农业的盲目乐观。不可否认的是,整个设施园艺行业正在跨步向数据分析4.0阶段积极探索,但国内大部分的项目应用还停留在1.0,甚至缺少有效数据分析的阶段。尽管深知数据的重要性,也从不同途径收集大量的数据,但是缺乏统一的储存介质,种植者很难将相关的数据放在一起分析。比如,种植者从传感器中收集环境数据,将环境信息记录在环控计算机中(图2);人工测量记录植物生长参数,记录在笔记本或者电子表格中;甚至一些第三方提供的能源监测数据、水肥消耗信息等,也都有不同的储存位置和格式,使用不同的时间格式或者分隔符。由于这种不兼容性,一方面为数据分析带来了大量的整理统计工作;另一方面,不同来源的数据常常会导致分析不够准确甚至出现问题。
荷兰种植者通常采用专业的数据平台进行数据的收集整理,并根据平台内置的算法和模型对数据进行解析,为种植赋能。有了专业的数据平台,就为进一步利用数据奠定了良好的基础。种植者可以根据自身的情况,从所关注的角度对相关数据进行对比分析,从而找到存在问题的答案或者制定新的策略。比如,根据产品销售情况优化能源投入,计算当前项目光能转化(果实产量)效率等。
AI技术的应用
对于种植者来说,与数据平台能够实时交互的种植管理系统才是理想的智慧园艺项目运行情景。作物监测系统向中央数据平台发送关于植物水分、能源和同化作用平衡相关的传感器数据。基于数据的信息,中控系统代替人类种植者,按照优化作物生长的方式进行决策,控制温室的运行。这一场景的实现,则得益于人工智能技术。那么什么是人工智能呢?
“公式”是用数学符号表示输入量和输出量之间关系(如定律或定理)的式子,用来表示行为相当稳定且输入量有限的物理和化学过程。当描述的过程包括众多的公式时我们称之为模型。在这个意义上,这个模型仍然模拟一个静态的、完全可预测的和易于理解的过程。当变量输入量的数量增加,输入量与输出量之间的关系变得不那么静态,甚至可能变成时间相关和非线性,而且系统的特性也随着时间变化,公式和静态模型将不再适用于模拟系统的过程行为。此时就需要AI技术登场。
温室内作物的生长过程可以看作一个极好的复杂动态系统,作物的生长不仅仅受到实际状态的影响,也取决于作物的历史。为了对整个动态系统进行描述,我们就需要借助AI技术的动态算法和模型的帮助,利用神经网络学习作物的历史数据,并通过大量的蕴含作物输入输出变量关系的数据集训练神经网络,这一过程叫做“深度学习”,属于“机器学习”的1个子集。在训练过程中,神经网络逐渐学习真正的植物的行为。当被给予新的輸入数据时,神经网络能够预测出植物相应的反应,它就成为了1个真正的作物模型。
用众多的模型来描述植物的生长和发展过程,比如预测产量和品质,计算能源与水肥投入以及预测病虫害的发生与防治等,就能形成一个决策支持系统,自动决策种植者在温室运营中需要考虑的问题。例如“基于目前的天气预报,接下来的一周最有可能发生什么情况?维持现有的控制策略,产量是否可以满足市场的订单?调整某个参数将会使果实的品相发生何种改变?”
以目前比较热门的产量预测为例。最早的产量预测模型大约出现在20年前,原理是大家熟知的积温和果实成熟度之间的关系,根据种植者填写的作物生理指标与可预期的温室温度对未来几周的产量进行预估。尽管这个模型被使用了几十年,预测的结果相对可供参考,但是预测的准确度还是有待提高。
依托机器学习研发的AI产量预测模型则具有更高的准确性。以LetsGrow.com开发的产量预测模型为例,平均精确性为90%以上。且随着训练年限的增加,准确性会越来越高。AI预测模型把多年来积累的大量的数据集合,包括气象状况、作物生理数据以及品质与产量相关的数据,作为机器学习的理想起点,在特定的栽培策略和植物类型下,找到环境、作物与生产之间的正确关系。这也是模型需要使用种植者自身的数据进行训练的原因,只有如此才能形成专属的预测模型,进而对未来1~4周的产量进行精准预测(图3)。
数据利用的发展阶段
园艺技能精湛的人通常被称为“绿手指”。荷兰人凭借其天生的忧患意识和贸易天分,将荷兰的设施园艺技术开发到极致并积极推广到全世界,是各国多年来一直学习和模仿的“绿手指”。荷兰种植者感知植物状态的能力,像极了中国大厨行云流水般颠勺翻炒,总是带着“加盐少许”般难以量化的神秘感觉。所谓的直觉和感觉,就是国内种植者要学习和消化的核心技能。而数据则是破译秘籍的钥匙。
生活在被数据包围的时代,大众对数据的力量深信不疑,也在以前所未有的速度创造和收集数据,世界上90%的数据都是在过去两年时间里收集的。先进的温室每天创造数据大约7500条/hm2,随着传感器技术以及智能设备的发展,这个数值还在持续不断地上升。面对庞大的数据,如何提取有价值的信息是值得大家关注的。有明确目标和宗旨的数据分析是为种植者提供有决策支持信息的重要手段。数据分析有4种类型,也代表人类对数据价值发掘利用的4个阶段:描述性分析、诊断性分析、预测性分析以及规范性分析。他们分别对应的问题和目标是“发生了什么?” “为什么发生这种情况?”“什么将要发生?”以及“什么是最有可能发生的?”(图1)。越高级的阶段,所需要涵盖的算法和模型就越复杂,所具有的商业价值也就越高。
关于数字农业分类的观点很多,一些观点甚至带着信息技术尝试 农业的盲目乐观。不可否认的是,整个设施园艺行业正在跨步向数据分析4.0阶段积极探索,但国内大部分的项目应用还停留在1.0,甚至缺少有效数据分析的阶段。尽管深知数据的重要性,也从不同途径收集大量的数据,但是缺乏统一的储存介质,种植者很难将相关的数据放在一起分析。比如,种植者从传感器中收集环境数据,将环境信息记录在环控计算机中(图2);人工测量记录植物生长参数,记录在笔记本或者电子表格中;甚至一些第三方提供的能源监测数据、水肥消耗信息等,也都有不同的储存位置和格式,使用不同的时间格式或者分隔符。由于这种不兼容性,一方面为数据分析带来了大量的整理统计工作;另一方面,不同来源的数据常常会导致分析不够准确甚至出现问题。
荷兰种植者通常采用专业的数据平台进行数据的收集整理,并根据平台内置的算法和模型对数据进行解析,为种植赋能。有了专业的数据平台,就为进一步利用数据奠定了良好的基础。种植者可以根据自身的情况,从所关注的角度对相关数据进行对比分析,从而找到存在问题的答案或者制定新的策略。比如,根据产品销售情况优化能源投入,计算当前项目光能转化(果实产量)效率等。
AI技术的应用
对于种植者来说,与数据平台能够实时交互的种植管理系统才是理想的智慧园艺项目运行情景。作物监测系统向中央数据平台发送关于植物水分、能源和同化作用平衡相关的传感器数据。基于数据的信息,中控系统代替人类种植者,按照优化作物生长的方式进行决策,控制温室的运行。这一场景的实现,则得益于人工智能技术。那么什么是人工智能呢?
“公式”是用数学符号表示输入量和输出量之间关系(如定律或定理)的式子,用来表示行为相当稳定且输入量有限的物理和化学过程。当描述的过程包括众多的公式时我们称之为模型。在这个意义上,这个模型仍然模拟一个静态的、完全可预测的和易于理解的过程。当变量输入量的数量增加,输入量与输出量之间的关系变得不那么静态,甚至可能变成时间相关和非线性,而且系统的特性也随着时间变化,公式和静态模型将不再适用于模拟系统的过程行为。此时就需要AI技术登场。
温室内作物的生长过程可以看作一个极好的复杂动态系统,作物的生长不仅仅受到实际状态的影响,也取决于作物的历史。为了对整个动态系统进行描述,我们就需要借助AI技术的动态算法和模型的帮助,利用神经网络学习作物的历史数据,并通过大量的蕴含作物输入输出变量关系的数据集训练神经网络,这一过程叫做“深度学习”,属于“机器学习”的1个子集。在训练过程中,神经网络逐渐学习真正的植物的行为。当被给予新的輸入数据时,神经网络能够预测出植物相应的反应,它就成为了1个真正的作物模型。
用众多的模型来描述植物的生长和发展过程,比如预测产量和品质,计算能源与水肥投入以及预测病虫害的发生与防治等,就能形成一个决策支持系统,自动决策种植者在温室运营中需要考虑的问题。例如“基于目前的天气预报,接下来的一周最有可能发生什么情况?维持现有的控制策略,产量是否可以满足市场的订单?调整某个参数将会使果实的品相发生何种改变?”
以目前比较热门的产量预测为例。最早的产量预测模型大约出现在20年前,原理是大家熟知的积温和果实成熟度之间的关系,根据种植者填写的作物生理指标与可预期的温室温度对未来几周的产量进行预估。尽管这个模型被使用了几十年,预测的结果相对可供参考,但是预测的准确度还是有待提高。
依托机器学习研发的AI产量预测模型则具有更高的准确性。以LetsGrow.com开发的产量预测模型为例,平均精确性为90%以上。且随着训练年限的增加,准确性会越来越高。AI预测模型把多年来积累的大量的数据集合,包括气象状况、作物生理数据以及品质与产量相关的数据,作为机器学习的理想起点,在特定的栽培策略和植物类型下,找到环境、作物与生产之间的正确关系。这也是模型需要使用种植者自身的数据进行训练的原因,只有如此才能形成专属的预测模型,进而对未来1~4周的产量进行精准预测(图3)。