论文部分内容阅读
机器学习是信息科学领域的热点研究课题之一,在控制工程、机器视觉、信息安全、生物信息和医疗诊断等众多领域具有广泛应用。高斯过程模型是近几年发展起来的一种新的核机器学习方法,除传统核机器学习方法的优点外,它还具有易于实现、完全的贝叶斯公式化表示、可自适应地获得超参数等优点。本文研究基于高斯过程模型的机器学习算法以及应用问题,主要包括:1、多示例学习算法研究。利用高斯过程模型建立了一种新的多示例学习算法,该算法可以通过定义不同的似然函数来描述各种多示例假设所假定的样本的示例与标签间的关系,从而能有效处理满足不同多示例假设的各种应用问题。在多个基准数据集以及图像的兴趣区域检测问题上的仿真实验结果表明该算法具有良好的性能。2、多示例多标签学习算法研究。基于高斯过程模型建立了能同时描述样本的示例与标签、标签与标签间关系的多示例多标签学习算法,基本思想是定义一组服从高斯过程分布的潜变量函数,然后通过潜变量间的协方差矩阵表示标签与标签间的关系,通过定义新的似然函数或者多示例核来描述示例与标签间的关系。在机器人视觉导航问题以及一些基准数据集上的仿真实验结果表明该算法要优于已有算法。3、Twin高斯过程模型研究。针对传统高斯过程模型计算复杂度高的问题,建立了一个用于处理分类问题的具有较低计算复杂度的新模型,基本思想是为每一类样本定义一个潜变量函数,使得它们在其所对应类的样本上的值尽可能地小而在另一类样本上的值尽可能地大,这样就可以利用高斯函数作为似然函数,从而得到后验分布的分析表达式,极大地降低了模型的计算复杂度。仿真实验结果表明,该模型不仅计算复杂度较低,而且能取得与已有模型相当或者更高的预测精度。4、Stewart平台位姿正解的实时、高精度求解算法研究。提出了一种通过引入中间变量简化原始多变量问题为若干单变量或者二变量问题进行求解的策略。应用该策略,分别基于独立成分分析方法和高斯过程多任务学习方法寻找中间变量,建立了两个数值求解算法,在多个Stewart平台上的仿真实验结果表明,基于高斯过程多任务学习方法的数值求解算法要优于各种已有算法,基本能达到实时性和高精度要求。5、多定位点蛋白质亚细胞定位预测算法研究。利用高斯过程模型建立了一种可以同时解决定位点间关联关系描述、各种特征信息的优化组合以及数据不平衡问题的预测算法,算法利用潜变量函数间的协方差矩阵描述定位点间的关联关系,通过定义一个新的似然函数实现各种特征信息的优化组合,通过为联合似然函数中的各类样本增加不同的指数权重系数解决数据不平衡问题。在人类蛋白质数据集上的实验结果表明,该算法能取得较高的预测精度。