论文部分内容阅读
本研究针对如何高效地挖掘处方大数据并辅助精准诊断的问题,以番茄病毒病、番茄晚疫病、番茄灰霉病3种病害为研究对象,构建基于贝叶斯优化LightGBM的番茄病害智能诊断模型,探索作物病害处方数据挖掘及其精准诊断。重点对处方原数据(文本数据标签和One-hot编码等)进行预处理,以基于Wrapper的递归特征消除法进一步提取作物病害处方数据的特征;利用基于LightGBM算法构建番茄病害诊断模型,并与K-近邻(KNN)、决策树(DT)、支持向量机(SVM)、随机森林(RF)、梯度提升决策树(GDBT)、AdaBoost和XGBoost常见机器学习模型运行结果进行比较分析并进行优化;设计基于LightGBM模型的Android手机端植物医生病害诊断APP。实验结果表明,基于贝叶斯优化的LightGBM模型综合诊断准确率可达到89.11%,比其他7种机器学习模型的诊断准确率平均高3.65%;同时特征选择后的LightGBM模型在保证模型准确率的基础上降低了前期数据收集难度,模型综合准确率提高至89.34%,其中番茄病毒病的诊断精确度和F1值均达到96%以上,运行时间减少了47.73%;最后通过番茄叶霉病和番茄早疫病两种病害对本文模型进行了泛化能力测试,实验结果表明该模型具有较强的泛化能力和实用性。基于LightGBM模型设计的APP可以实现用户人群友好的交互式可视化且满足实际诊断需求。