自适应模型选择学习算法的研究及应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:pengdou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高斯混合模型作为一种重要的概率模型已被广泛地应用于模式识别、图像分析、信息处理和数据挖掘等诸多领域。在高斯分量个数已知的情况下,许多学者对高斯混合模型的参数估计问题进行了深入地理论研究,并建立了有效的迭代型学习算法,即EM算法。然而在许多实际应用中,高斯分量个数是未知的或难于准确估计的。这时如何既能估计出模型中分量个数又能对混合模型中的参数进行有效的估计则成为一个非常重要而困难的问题。显然,该问题的难点主要在于高斯分量个数的估计上,因为错误的高斯分量个数必然导致高斯混合模型的参数估计或学习算法收敛到一个错误结果。由于混合模型的分量个数反映了其规模或尺度,因此分量个数的选择问题被称为模型选择问题。实际上,许多学者对于模型选择问题进行了很多有益的探索。一种传统的模型选择方法就是基于某种信息或统计准则来进行判别,但这些准则常常出现错误,并且需要大批量的参数估计而耗费大量的时间。近年来,针对高斯混合模型的模型选择和参数估计问题,人们从统计学习的角度提出了自适应模型选择的研究思路,即在参数学习过程中让高斯分量个数自动地适应数据结构和特点,达到最后正确匹配的结果。自适应模型选择可通过尺度(分量个数)增长型、压缩型和动态变化型学习方式来实现。   贝叶斯阴阳(Bayesian Ying—Yang,简称BYY)和谐学习系统与理论为统计学习提供了一个统一的学习理论和框架。它不仅可以很好地解释一些已有的学习算法,并能够产生出一些新的学习系统和机制。针对高斯混合模型的建模问题,已经建立了基于BYY的和谐学习模型和准则。在此基础上,本文对于分量和谐匹配进行了深入的分析,首先提出了尺度增长EM算法来解决高斯混合模型的模型选择和参数估计问题。另一方面,由于动态模型选择方法具有更多的灵活性,我们对于基于BYY和谐学习的动态模型选择算法进行了深入的探索并建立了有效的学习算法。在BYY和谐学习准则下,我们建立了动态学习的几种不同的分裂与合并方法。根据这些方法,我们能够使得在学习过程中混合模型中没有与真实数据分量相匹配的参数分量进行合理分裂或合并,最后达到正确的模型选择和有效地参数估计。   通过实验和分析,我们发现所提出的两种统计学习算法能够自适应地解决高斯混合模型针对一组数据的模型选择问题,并且其性能是可靠和稳定的。另外,我们将这些算法成功地应用到基于高斯混合模型的直线检测、彩色图像分割、纹理分割与分类等领域,其性能都优于传统的方法。通过实验发现,自适应模型选择功能能够自动地确定实际数据中的分量或类别个数,提高了所建模型的准确性和精度,大大提高了数据建模和实际应用的效果。实验结果表明,本文所提出的自适应模型选择算法在效率和稳定性方面均优于传统的统计学习算法。
其他文献
本文就一类重要的非线性偏微分方程——Cahn-Hilliard方程的差分格式的收敛性和稳定性研究展开了讨论.   Cahn-Hilliard方程在物理、化学领域起着重要作用,许多物理、化学现
闽经贸能源[2012]543号三明市经贸委、物价局、省电力有限公司:根据省物价局、省经贸委、省环保厅和省财政厅《关于对落后产能企业实行差别电价的通知》(闽价商[2012]57号)精
本文考虑了一类三维和四维系统的周期轨道的分支问题.众所周知,关于平面系统的极限环的分支的研究已经较为成熟,人们已建立起来研究其分支的基本理论与方法,但对于高维系统的分支
本文基于卵巢癌真实数据集,构建了预后因素评价和生存率预测方法。根据协变量为多水平分类变量的特点,我们运用了回归分类树(CART)和Cox模型相结合的CART-COX方法,并且将这种方
自从1973年5月,Black& Schloes两人合作在《政治经济学杂志》(Journal of Political Economy)上发表了论文《期权和公司负债的定价》(The Pricing of Options and Corporate Liab
自由曲面的生成和重构,一直是CAD/CAM研究的重要课题,在汽车、轮船、飞机、塑料等许多制造业中,有着广泛的应用背景。因为在这些行业中常常会遇到很多逆向工程(Reverse engineeri
贝叶斯网络是一系列变量的联合概率分布的图形表示。它具有强大的概率推理能力、自然清晰的表达方式、易于理解等优点,是目前不确定知识表示和推理的重要工具之一,也是近些年人
我们生活在一个信息化的时代,各种信息急剧膨胀,“数据丰富,知识贫乏”成为人们越来越关注的问题。为了有效利用这些信息,数据挖掘和知识发现技术应运而生,并显示出强大的生命力。
本文共分为两章。   第一章主要介绍了连续状态分枝过程的定义和一些基本性质,并且给出了一些关于连续状态分枝过程矩的等价关系的引理.另外,本文证明了关于连续状态分枝过
本文主要内容可归为以下几点:   1.令(X,d)为一非空紧致度量空间,f:X→X为连续满射,其逆极限空间为X,σ为X上的转移映射,若f为Block-Coppel混沌的,则σ为Block-Coppel混沌的;f为DC2混