论文部分内容阅读
随着大数据时代的到来,数据挖掘方法在各个领域显示出强大的信息挖掘能力,利用数据挖掘技术可以寻找隐藏在数据中的关联信息,方便人们进行科学决策。近年来,受新冠疫情、气候环境变化等因素影响,部分农产品价格波动频繁,波动幅度较大。通过机器学习方法,若可以建立一种模型,用来预测未来农产品价格走势,则可以方便有关部门做出科学决策部署,从而减少农产品价格剧烈波动所带来的社会影响。因此,有必要开展数字农业下基于机器学习方法提高农产品短期价格预测精度的研究,无论是对个体经营、还是企业体系、或是政府调控、乃至整个社会的和谐发展,都具有重要意义。本文的主要研究工作如下:(1)通过布瑞克大数据平台终端,收集全国各个地区农产品价格日报及周报数据。对数据进行了初步的分析与整理,包括数据的清洗、杂乱数据的整合、数据的归一化等,并以图的形式展示了农产品价格数据分布情况,为多维时空关联规则挖掘做准备。(2)改进了传统的关联规则挖掘方法,提出了一种多维时空关联规则挖掘理论方法,通过扩展数据的时间维度,根据农产品不同属性特征,分别设置数值转换系数,再通过关联规则挖掘影响目标价格波动的时空影响因素,为后续预测模型的输入提供特征参数。(3)构建多种机器学习价格预测模型,包括多元线性回归、反向传播(Back Propagation,BP)网络、长短期记忆(Long Short-Term Memory,LSTM)网络、随机森林、极值梯度提升(e Xtreme Gradient Boosting,XGBoost)网络五种模型,分别用未扩展时间维度的数据集和经多维时空关联规则挖掘筛选后的数据进行实验。实验结果表明经过多维时空关联规则挖掘后,其中四种模型的预测效果有了显著提升,最优模型为关联规则挖掘后的多元线性回归模型,R~2为0.9705。