论文部分内容阅读
西瓜成熟度无损检测是西瓜品质检测研究中的一个核心问题,近红外、核磁共振、X射线、声学等众多的方法被应用到西瓜成熟度检测。目前西瓜品质智能检测技术尚未在实践中推广,主要原因是检测算法的有效性、快速性、稳定性和易实现性等未达到应用上的要求。本文考虑未熟、成熟和过熟三个成熟度等级的西瓜声学分类问题,通过主成分分析(Principal component analysis,PCA)和核主成分分析(kernel principal component analysis,KPCA)提取西瓜敲击响应信号的特征,利用极限学习机(Extreme Learning Machine,ELM)构建西瓜成熟度分类和西瓜含糖量检测模型,主要的工作如下:1.提出基于(核)主成分分析的西瓜敲击响应信号的特征提取方法。通过不同成熟水平声信号样本的(核)主成分分析获得感兴趣的主成分,将其对应的特征向量线性扩张成有限维的特征空间,用信号在特征空间上的正交投影系数作为特征。PCA能够在保留足够多原始信息的同时大幅度降维,计算直接且简单。在保留95%主成分的条件下,PCA和KPCA分别将原始信号维数由4096降低到31和90。2.提出基于Markov chain采样的极限学习机算法。ELM是一个单隐层前馈神经网络学习系统,其输入层权重和隐层阈值是随机固定的,算法的核心是计算输出矩阵的Moore-Penrose广义逆。该算法简单、运行速度快,且优于支持向量机(SVM)、BP神经网络等机器学习算法。本文在Tikhonov正则化理论分析基础上,将独立同分布数据下的ELM泛化性能的进行推广,给出了基于Markov chain采样的ELM算法误差上界的估计。同时,基于真实数据,将独立同分布与Markov chain采样条件下的ELM进行了对比分析。实验结果表明,Markov chain采样不仅能有效降低ELM的预测误差,且能够提高ELM的鲁棒性。3.构建基于高斯核函数的KPCA-ELM西瓜成熟度分类模型。首先,按2:1的比例将样本进行随机划分,获得训练集样本180个,测试集样本90个。其次,以ELM为分类模型,分析了由PCA和KPCA提取的特征对西瓜成熟度检测的影响。同时,讨论了基于线性、多项式、高斯、S型四种核函数的KPCA-ELM分类模型对西瓜成熟度的检测效果。最后,从分类准确率和速率两个角度,将ELM与K-最近邻(KNN)、BP神经网络和SVM三种分类模型进行了对比分析。实验结果表明,基于高斯核函数的KPCA-ELM的模型效果最优,在二分类和三分类两种西瓜成熟度检测场景下的识别准确率分别为95.72%和89.23%。4.构建基于高斯核函数的KPCA-ELM西瓜含糖量检测模型。利用ELM构建西瓜含糖量与敲击响应信号之间的回归模型,分析了PCA、KPCA提取的特征对西瓜含糖量检测模型的影响。同时,也将ELM与偏最小二乘(PLS)、BP神经网络、支持向量回归(SVR)进行了对比分析。实验结果表明,基于KPCA-ELM的西瓜含糖量检测模型的性能最佳,其能够得到最小均方根误差(Root mean square error,RMSE)为0.3725,标准偏差(Standard deviation,STD)为0.0173。