论文部分内容阅读
目前,机器学习不仅是人工智能的一个核心研究领域,而且已成为整个计算机领域中最活跃、应用潜力最明显的领域之一,它扮演着日益重要的角色。作为机器学习中一个重要的研究分支,贝叶斯学习理论及其代表性学习方法相关向量机在近10年的发展中日益发挥着越来越重要的作用,并在相关研究领域取得了丰硕的成果。相信贝叶斯学习理论及相关向量机将会成为机器学习领域最重要的主流研究方向。 本文针对相关向量机中亟需解决的7个问题进行了研究,包括学习机的选择、核函数的选择、核参数的选择、提高普遍适应性、分类数据的整体把握、模拟生物神经系统及将相关向量机方法与传统的模式识别方法相结合。主要的研究工作有: (1)学习并研究了统计学习理论及支持向量机、贝叶斯学习理论及相关向量机,并在数据集上对支持向量机、信息向量机、相关向量机三种方法进行了学习机的选择比较,在时间消耗相似的情况下,相关向量机在分类误差及内存占用上都取得了良好的效果。 (2)在确定了采用相关向量机作为研究对象后,针对相关向量机中的重要部分核函数进行了研究,对原始的高斯核函数进行了改进,提出了修正的高斯核函数方法。在对单一核函数改进的基础上,进行了混合核函数相关向量机的研究,并在不同大小的数据集上对几种核函数进行了对比实验,验证了修正的高斯核函数及混合核函数的效果。 (3)本文也对核函数中的重要部分核参数进行了研究,在对核参数修改效果不佳的情况下,间接引入最近邻的方法减少分类误差,降低了相关向量机算法对核参数的依赖。 (4)多数算法对数据集的依赖性很强,为了适应各种数据集,本文提出了基于临界滑动阈值KNN-RVM算法,并在多数数据集上进行了测试实验,证明其良好的普遍适应性。 (5)针对数据集中的全部数据,提出了临界滑动阈值的概念,并以此为基础从全局数据考虑对算法进行了改进,减少了分类误差,改变了传统的改善分界面附近部分数据的思想,取得了好的效果。 (6)本文利用相关向量机算法很好的模拟了生物神经系统,具体的利用相关向量机完成了猴子神经状态的识别及行动轨迹的预测,应用效果明显。 (7)基于临界滑动阈值KNN-RVM算法的提出是将贝叶斯学习算法与传统的模式识别方法相结合的具体实现,为其他类似的结合与应用提供了良好的借鉴与参考。