基于改进EM算法的混合模型参数估计及聚类分析

来源 :西北大学 | 被引量 : 0次 | 上传用户:xwxseven
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
EM算法由于在参数估计等领域的广泛应用,近年来发展十分迅速。但EM算法也存在一些自身缺陷,诸如迭代公式推导复杂,收敛速度对迭代初值选取依赖较大,以及如何将其改进用于混合分支数未知情况下的混合模型参数估计问题,本文正是基于对上述问题的解决加以展开的。首先,在本文第一章大致介绍了EM算法的产生背景及其原理、性质。其次,在第二章中,通过具体的算法实施过程,向读者展示了EM算法在混合模型参数估计中原理简单、思路清晰的优越性,同时也让读者感受到推导过程的复杂性,基于此,本文采取将复杂问题拆解为简单问题累加的处理思路,给出了改进的EM算法在混合正态参数估计中迭代公式的推导过程,且迭代公式与传统EM算法一致,但推导过程相对简便。同时,给出了一种基于K-means聚类算法的迭代初值选取方法。在第三章中,由于用EM算法在混合模型参数估计中涉及到运用后验概率密度实现数据分组,加大了计算的复杂度,影响了算法的效率。本文参照常规K-means动态聚类法,在每次迭代过程将参数修正和数据聚类交替完成,并引进示性函数,将复杂的带小数的数据转化成0-1离散型数据,降低了运算的复杂度。如何确定聚类个数一直是聚类分析中一个难点,本文在传统EM算法的基础上引进了竞争惩罚权重因子,使多余的分支密度函数淘汰,而将真正的分支加以保留,从而确定模型的分支个数,再用传统EM算法求解模型参数,从而解决了分支个数未知情况下混合模型的参数估计问题。在本文结束部分给出的数据聚类和参数估计的数值模拟结果反映了上述改进算法的可行性。
其他文献
目的分析目前版本的华西肠癌数据库(Database from Colorectal Cancer,DACCA)中,华西医院作为区域性医疗中心所服务的结直肠癌患者的术前专科检查与评估情况。方法本次数据分
综合管廊是城市基础建设的一个重要组成部分,它的建设能优美城市环境,减少城市道路重复开挖,并且预留了未来发展所需的地下空间。但管廊的建设期长,投资回报率慢。而政府可用
卵巢癌是人类最难治愈的癌肿之一,尽管许多年来手术、化疗和放疗均已取得了长足的进展,但术后复发和化疗耐药仍然难以突破,晚期卵巢癌的五年生存率始终得不到改善。近些年来,随着
<正>如今,西安医药保健品进出口公司的名称随着企业改制已经成为历史,改制后的企业名称已经看不到"医药"二字,这让许多一直从事医药进出口的老员工感到茫然。事实上,这种茫然
背景与目的 肾母细胞瘤(Nephroblastoma)又称肾胚胎瘤,是小儿最常见的腹部恶性实体瘤,占肾脏肿瘤第一位(97%)。Max Wilms于1899年对该瘤的特征进行了详细的描述,故被命名为Wil
从四川卧龙中国保护大熊猫研究中心提供的野外放归大熊猫“祥祥”的12份粪样中进行产纤维素酶细菌的分离,通过刚果红染色法分离到51株能在“羧甲基纤维素钠(CMC-Na)—刚果红”
电力电子技术的飞速发展给人们的生产和生活带来了诸多便利。与此同时,电力电子装置的广泛使用导致大量谐波注入电网,造成“电网污染”,进而威胁到各装置的正常运行,同时也增加了发生危险事故的概率。因此,谐波的治理显得尤为重要。近年来,由于有源滤波器在治理谐波问题上效果显著,因此得到了广泛的重视和应用。目前单相设备在电力电子设备及日常生活中占的比例要远大于三相设备,所以对单相有源滤波器展开研究具有现实需求和
近年来,乐陵市坚持问题导向,不断解放思想,将统战工作与党建工作相结合,以"六型统战"、乡贤联谊会和基层商会建设为三条主线,打通了统战工作"最后一公里",夯实了基层党建,助
微分几何学是一门历史悠久的学科.可以这样说,微积分诞生的同时就诞生了微分几何,这门学科的生命力至今还很旺盛.近年来它对数学中其他分支的影响越来越深刻,对自然科学系的
随着中国的经济社会不断进步,商用车需求持续增长,不仅促进了国内各商用汽车制造企业的快速发展,同时还吸引了国际知名汽车制造商纷纷进入中国,提升制造业智能化的水平,抢占