高斯混合模型的数据尺度可压缩的参数学习和自动模型选择算法

来源 :北京大学 | 被引量 : 0次 | 上传用户:leongiggs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据分析和自动化处理中,高斯混合模型是一种非常有效的概率模型和分析工具。在实际应用中,我们所遇到的许多数据都可以看作来自于多个高斯分布的线性混合体,即高斯混合模型。在高斯混合分布的建模方面,人们已经提出了多种行之有效的算法。早期的算法是在高斯分量个数已知的情况下进行参数估计的,如基于参数学习的EM算法。但当高斯分量个数未知时,这些算法就无法取得满意的效果。为了克服这一缺陷,最近所提出的基于BYY和谐学习原则的自动模型选择的不动点学习算法很好的地解决了分量个数或模型选择与参数估计这一交错问题,使得参数学习过程中自动完成了模型选择。但随着样本数据的不断积累,出现了大尺度的数据源。如果直接使用这些大尺度的数据,这些学习算法会耗费大量的时间,并占有巨大的储存空间。为了解决这一问题,人们提出了数据尺度可压缩的算法的思想,即我们先对于大尺度的数据进行处理和压缩,降低数据的尺度,但最大限度的保持原来数据中的信息,然后将算法作用在压缩处理后的数据集上,得到模型参数的估计。本文对于基于高斯混合模型的数据尺度可压缩的学习算法进行了新的探讨,提出采用频率敏感竞争学习(FSCL)算法进行数据压缩和处理的方案,并将其应用到EM算法和BYY不动点学习算法。通过模拟数据的实验和图像分割实验,我们验证了这种方案的可行性和有效性。
其他文献
竹林生态旅游是指在被保护的竹林生态系统内,以观赏竹林生态景观为主要目的的旅游,竹林生态旅游以竹为主要观赏对象、以构成景观的竹林和竹文化为旅游目的地,旅游者通过与自然的
通信技术发展日新月异,在3GPP Release10(Rel-10)和Re1-11中,提出了可以有效提升链路的质量和频谱效率,解决宏网络覆盖空洞的的分层异构无线网络的技术方案,通过在宏覆盖范围
近年来随着遥感卫星数据的急速膨胀,以往的卫星数据记录和处理系统,以及技术方法逐渐不能满足业务应用的需求,中国遥感卫星地面站提出了建设多元卫星海量数据存储与处理系统,对地
智能视频处理技术涉及到许多基本技术,由于存在一些关键性技术仍然没有得到很好地解决,致使智能视频处理技术在其发展过程中受到一定程度的阻碍。本论文针对当今各种智能视频处
本文对采用均值位移,卡尔曼滤波和快速运动估计的物体跟踪算法进行了研究。文章深入分析了Mean Shift跟踪算法原理,并对它跟踪物体的本质进行了探讨,由此对它的权重更新方式进行
本文针对目前自然语言处理领域的研究热点--信息检索模型存在的问题,结合统计自然语言处理以及HNC自然语言理解技术的研究现状,提出了将语义方法与统计方法结合进而构建检索模
本文主要对指纹识别技术中的指纹比对技术进行若干探索和研究。 当今社会中,生物特征识别技术在社会生活的各个方面有着越来越广泛的应用,作为生物特征识别领域研究历史最久
随着我国农业生产工作现代化进程的不断加快,各种机械设备以及新的生产理念都在生产工作当中得到了普遍的推广,这对农作物本身的质量与生产效率都有重要的促进作用.保护性耕
离子迁移率谱仪(IMS)是二十世纪七十年代发展起来的一门新兴的化学分析技术,被广泛应用于测定痕量的化学武器、毒品、爆炸物、以及空气污染物等,跟其他的有机化合物分析仪器相
人们通常希望知道在特定的宏观经济状况和市场环境下,某一支股票在一定的时间内是否具有投资的价值。通过对历史数据的学习构建准确的模型,进而分析所有潜在的可能影响因素对股