论文部分内容阅读
基于数据的机器学习问题是现代智能技术中十分重要的研究内容,该技术主要是研究如何从一些观测数据(样本)出发,得出目前尚不能通过原理分析得到的规律,利用这些规律去分析客观世界中的各种对象,并对未来数据或无法观测的数据进行预测。 现有的机器学习方法的重要理论基础之一是统计学。传统统计学研究的是样本数目趋于无穷大时的渐进理论,现有的学习方法也多是基于此假设。然而在实际问题中,样本数目往往是有限的,因此这些方法存在着固有的缺陷。 与传统的统计学方法相比,统计学习理论是一种专门研究有限样本情况下机器学习规律的理论。在此理论框架下产生的支持向量机(SVM)方法,使抽象的统计学习理论转化为实际的学习方法。 然而,由于SVM尚处于发展阶段,许多方面仍不完善,现有的成果也多局限于理论分析,而应用显的较为薄弱。因此对SVM理论进行进一步研究并将其应用于解决实际问题无疑具有重要的意义。本文在统计学习理论和SVM算法的基础上,对SVM算法在信号处理、纹理图像分类及异常点检测等领域的应用进行较为系统的研究,全文的主要工作包括以下几个方面: 1)提出了一种基于知识的支持向量机回归算法。传统的SVM回归算法是完全基于数据的,这就使得我们对于问题的先验知识在SVM的训练过程中无法得到充分利用。为了解决此问题,本文通过修改SVM算法的目标函数,将问题的先验知识耦合于SVM的训练过程中,从而使最后得到的SVM模型符合我们对要解决问题的先验知识的需要。同时,本文也讨论了如何对基于知识的支持向量机回归算法进行加权处理,以进一步提高回归性能的方法; 2)提出了一种新的用SVM算法对激光雷达信号进行去噪处理的方法。由于激光雷达信号的噪声分布在一个较宽的波段范围,而且几乎和有用信号在同一个带宽内。因此传统的滤波方法很难有效地对此信号进行去噪。如果直接用传统的神经网络方法或SVM算法对信号进行处理,则存在的问题主要有:(1).信号所含噪声不符合高斯分布;(2).激光雷达信号分布的特点等先验知识无法利用。此外,传统的神经网络方法也存在易陷入局部极小点、易产生过学习、网络结构选择困难等缺点。为解决上述存在的问题,本文提出了一种基于知识的SVM算法对激光雷达信号进行去噪处理的方法。首先对激光雷达信号的噪声,以及信号本身的分布特点进行分析,从而得出问题的先验知识,然后采用本文提出的基于知识的SVM回归算法对信号进行去噪处理; 3)详尽分析了用支持向量机实现多分类器融合的方法,并构造了一种新的多分类器融合模型。主要工作体现在如下二个方面:(1).对成员SVM分类器生成方法做了详尽的分析;(2).对目前常用的多分类器融合方法进行分析并对比其各自的优缺点,结合SVM的特点,提出了一种新的多分类器融合方法。其特点在于求解各成员分类器相应的权值时,不仅考虑了各成员分类器对训练样本的分类性能,而且还考虑了其泛化能力。由于本方法在计算各成员分类器的权值时需要求解的是一个二次规划问题,因此很容易得到问题的全局最优解; 4)提出了一种用支持向量机委员会对纹理图像进行多特征识别的方法。本文首先对纹理图像不同的特征提取方法的优缺点进行分析,然后根据这些方法的特点选择三种特征提取方法,得到不同的特征域;接着对于每个特征域进行训练得到一个SVM分类器;最后把得到的SVM分类器通过加权平均的方法融合在一起,得到一个SVM委员会用于最后的纹理图像识别; 5)提出了一种新的2-范数支持向量聚类算法,并将其应用于信号或图象中异常点的检测。传统的支持向量聚类算法是基于1-范数的方法,本文将其推广到2-范数的情况,并对因此而引起的聚类性能的变化进行分析。论文同时也讨论了如何将两种范数的支持向量聚类算法应用于信号或图象中异常点的检测,并通过IRIS数据和USPS手写体数字数据来验证算法的可行性。