论文部分内容阅读
模式分类是许多工程领域广泛应用的关键技术,化学模式分类问题是常见的模式分类问题。随着科学技术的发展,可以获取的化学模式信息越来越丰富,然而有些数据的测试成本却相当高。因此往往使数据样本呈现出:高维、小容量、关系复杂、非线性和分布不定等特点,为模式分类技术提出了新的挑战。 本论文首先对统计模式分类方法与前馈神经网络的分类能力进行讨论,然后把两者的优点结合起来,进一步提出了模式分类集成策略。根据这一思想,构建了集成模式分类器,对其性能进行分析,并应用于两个化学模式分类问题中。 判别分析方法是经典的基于多元统计分析的模式分类方法。判别分析的计算过程比较规范,又有明确的概率意义,但是样本容量要求足够大,而且样本应遵从一定的分布。对于化学模式分类问题,当模式的分量间存在较强的相关性时,单一采用判别分析的方法进行分类,效果并不理想。 前馈神经网络(多层前馈网络和径向基函数网络)是常用的神经元网络分类器之一,它的表达能力强,适用范围广,但前馈网络设计较为困难,训练过程比较费时,而且存在局部极值、过拟合等问题。提高前馈网络的拟和能力和训练精度,训练集的分类正确率可以达到较高水平,而测试集的分类正确率则提高幅度有限,有时甚至下降。 逐步判别分析是变量筛选的经典方法。通过对留兰香样本的分析,发现通过逐步判别分析,只选择那些重要的特:征变量,从而可以减少变量的个数和计算量。主成分分析和相关成分分析都是成分提取的有效方法。通过比较,发现对于化学模式分类问题而言,由相关成分分析而提取出来的分类相关成分的分类效果更好。 本论文的研究重点在于将前馈网络与统计方法的优点有机糅合,提出了模式分类的集成策略。神经网络的表达能力很强,对样本的分布几乎没有什么要求,利用前馈网络的自学习功能,将原有模式映射到新的模式空间,使其分布有利于分类。变换后的模式的分量间存在较大的相关性,因此有相关Wr ig(ABSTtobCT)成分分析的方法提取相互正交的分类相关成分,最后用判别分析的方法建立判别函数。 模式分类器的集成策略的主要内容为: ()根据多层前馈网络模型,提出了如何构建 WS*变换,将原有模式向量投影到新的模式空间。 ()根据RBF网络模型,设计了RBF.T变换,从而实现模式特征空间的转换。 p)结合统计的成分提取方法,有效提取模式向量的特征。 O)利用判别分析方法,确定模式的类别归属。 对比试验表明根据集成策略而构建的模式分类方法适用性好,分类性能强,对于不同性质的复杂化学模式分类问题都有良好的效果。 文章最后在对全文工作进行总结的基础上,展望了今后此领域进一步研究的方向。