Boosting方法在混合模型选择中的应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:Nick0409
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在模式识别这个领域中,混合模型是统计模式识别最主要的模型之一.混合模型的估计方法有很多,其中研究最多并且为人们所熟知的是EM算法.然而局部优化的EM算法可能会遇到一些问题,比如初始模型参数的选取,有时该算法还可能表示出不同的收敛速度,另外最困难就是模型阶数(模型的成分个数和维数)的确定.在混合模型中一个越来越重要的任务就是模型选择问题,即选择模型的成分个数和维数.目前的研究方法有MCMC还有变分法等等,但是解决的效果都不是很好.该文主要是利用Boosting算法的思想得出的一个估计混合模型的递归式算法.该算法可以相对精确地估计出混合模型中成分的个数,同时还可以得到模型中参数的估计.Boosting算法的主要思想是根据训练数据目前的权重调用某些基础分类算法从而更新训练数据的权重,不断这样迭代,最终得到这些基础分类器的加权组合.这个最终的分类器的效果明显高于那些基础的分类器的效果.最近许多专家把Boosting解释为是一种寻找最小化损失函数的分类器组合的梯度下降算法.Mason等人在他们的一篇文章中提出在分类器空间中寻找与损失函数的负梯度内积最大的分类器做为新的迭加的分类器这样的思想.既然Boosting可以理解为一个熟悉的优化问题,我们就可以把这一思想用到混合模型的建模中去,其中损失函数取为负对数似然.我们给出适当的停止规则就可以估计出一个模型的理想成分的个数.在算法具体的执行中我们将Bagging这样的方法用到其中可以使我们的算法产生较为理想的停止规则.从而避免了的成分数的选择和其他方法存在的某些问题.而且因为它以迭代的方式来估计参数的,因此该算法也适用于复杂密度的混合.我们的模拟实验也证明了它的上述特点.
其他文献
据宁波海关提供的统计数据显示,今年1月至2月,宁波口岸累计进口纸浆5.22万吨,价值2990.83万美元,与去年同期相比分别增长8.4%和30.1%;进口平均价格为572.96美元/吨,与去年同
活跃的课堂气氛能有效地提高教学效率,达到教学相长的目的.教师在课堂教学中,要以学生为主体,充分发挥学生的主体作用,激发他们的学习兴趣,调动学习积极性,真正做到教师只是
该文综述了近年来关于Iyengar型积分不等式的一些研究方法和成果.利用余项为积分形式的Taylor公式给出了一个统一的含参数的Iyengar型积分不等式,在此基础上重新给出了经典的
井筒揭含水(气)层岩段时须采取必要的措施,既要防止岩石与瓦斯突出,同时还要考虑防水的措施,在主要论述防止岩石与瓦斯突出的基础上,综合考虑了防水的一些预防措施。 When t
该文的第一章将单内射环推广到单拟内射模,进而将关于单内射环的一些结果推广到模上.第一节给出了双模M是右单拟内射模的一个等价刻画.并且得到了Kasch的单拟内射模的一些结
数学解题策略教学是一种较高层次的学习活动,它对于问题的解决具有重要影响。教学实践证明,教学中对学生进行解题策略训练和指导,有利于学生数学能力的提高和数学素养的形成
约束条件下的统计推断已成为统计分析中一个重要的研究领域,到60年代,约束条件下的统计推断得到广泛的重视,以后成为热门话题,并且每年都召开国际性会议。而保序回归和共积的
最典型也最简单的椭圆型偏微分方程是调和方程,又称Laplace方程。力学和物理学研究中的许多问题都归结为Laplace方程的边值问题。例如:弹性膜的平衡问题,稳定状态的热传导问题,不
随着地球人口的快速增长和生活水平的不断提高,人们对自然资源的需求越来越大,致使有限的陆地资源不堪负重,正面临枯竭的危险,为此,人类正掀起一场以“蓝色革命”为目标的新技术革
人工神经网络发展到今天,已有五十多年的历史。在一代又一代学者的不懈努力下,不但理论基础逐渐充实、成熟,而且在信号处理、计算机视觉、模式识别、专家系统、工业控制与气象预