论文部分内容阅读
有效快捷的白酒检测方法对于杜绝市场上假冒伪劣白酒具有重要意义,仪器检测手段结合模式识别方法进行白酒的品质鉴定日益广泛。特征变量选择和识别算法建立及优化是模式识别的关键任务,特征变量的选择本质是优化问题,试验设计是解决优化问题的重要工具,支持向量机(Support Vector Machine, SVM)是一种性能优良的机器学习算法。本文基于试验设计和支持向量机算法对白酒的品牌分类问题进行了相关研究。本文首先运用正交试验方法对从UCI基准数据库选取的3个数据集进行特征选择,实验结果验证了应用该方法进行特征选择是可行有效的,然后将试验设计方法应用于白酒质谱特征选择中,并对比分析了其他特征选择方法。利用单光子电离飞行时间质谱(Single Photon Ionization Time of Flight Mass Spectrometry, SPI-TOFMS)以顶空进样方式采集白酒谱图,通过对原始谱图进行适当的数学转换,生成六类430个谱图特征,通过Fisher比率将特征维度降为200,以SVM为分类器应用正交试验设计方法进行特征挑选,实验得到68个优化谱图特征,结果表明正交试验设计(Orthogonal Experiment Design, OED)方法能够有效地去除白酒数据集的冗余特征。本文通过分析关键参数对支持向量机设计的影响,引出参数优化的重要性。梳理现阶段常用的三种优化算法,对OED方法选择出的白酒特征数据进行支持向量机参数优化实验,分析不同参数寻优方法对支持向量机分类器性能的影响。针对网格搜索存在搜索时间过长的问题,采用一种改进策略,即在较大参数范围内以较大步长进行粗略搜索,再在得到优化结果的附近区域进行精细搜索,实验证明了这种改进策略的有效性。本文利用单光子电离飞行时间质谱检测手段,结合正交试验和支持向量机方法建立了快速准确鉴别白酒品牌类别的方法。本文的研究是对现有白酒品质鉴定方法的有益补充,也是这种方法在白酒分类领域的新应用。