基于EM算法的缺失数据的统计分析及应用

来源 :重庆工商大学 | 被引量 : 0次 | 上传用户:dengjuanjuan8288
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
EM是一种专门用于求解参数极大似然估计的迭代算法。特别地,它为有缺失数据条件下的参数估计提供了一个标准的理论框架,这里的缺失有以下两种情况:一种是我们所研究的问题中确实存在数据的缺失;另一种是原始数据是完全的,但由于似然函数的求解十分困难,而额外添加一些数据就能将原来十分复杂的过程转化成一系列简单的似然函数优化问题,于是原始数据自然就成为了不完全数据。由于EM算法具有良好的收敛性和每次迭代都能使似然函数值单调不减的优良性质,所以许多与缺失数据有关的问题中都会结合EM算法来分析,也难怪有学者称EM算法和缺失数据如同一对孪生姐妹一般总是如影随形。本文主要对EM在含缺失数据的统计分析及应用中作了以下几方面的研究:(1)引言。主要介绍了本文研究的背景、意义以及国内外研究现状。(2)理论基础的构建部分。首先介绍了缺失数据的产生的原因、机制和模式;其次对极大似然估计的理论作了简要概述;最后介绍了EM算法的相关理论,在这一部分中详述了对EM算法的几种解释,从而加深了对该算法的理解。(3)EM算法在含缺失数据的调查表中的应用。这是EM算法在实际生活中的一类非常重要的应用,在这部分中我们首先将该算法应用在常见的调查表中数据有缺失的情形,然后以重庆市居民的交通起止点调查表为例,用EM算法来补全表中的数据并对其中的参数进行估计,从而很好的展现了该算法的实用价值。(4)EM算法在混合模型中的应用。在这一部分中我们主要研究了EM算法在二阶高斯混合模型和多层混合模型中的应用,其中在研究EM算法在二阶高斯混合模型中的应用时,我们将观测数据划分成(X,Y)和整体Y的形式,分别在这两种形式下给出模型中参数的估计,并用Matlab软件进行了随机数值模拟;在研究多层混合模型时,我们以二项-泊松多层混合模型为例给出了EM算法在该种模型下的参数估计,并用具体的实例来验证了EM算法在处理这类复杂的混合模型参数估计方面的优势,为EM算法在其它复杂混合模型中的应用提供了很好的借鉴。
其他文献
中国制浆造纸研究院 刘金刚报道 2009年9月19-30日,由中国制浆造纸研究院牵头组织的技术考察团赴加拿大进行学术交流访问.访问团由承担“十一五”国家支撑计划课题的12名成员
全国造纸工业标准化技术委员会报道 2009年10月13-17日,全国造纸工业标准化技术委员会(以下简称造纸标委会)年会在重庆顺利召开.
这里所谓的人物专稿,是对人物通讯、人物专访和人物特写的统称。与人物消息相比,人物专稿可以用更多的笔墨,更详尽、更生动地描绘新闻人物,可以用叙述、笔录、描写、议论与抒
新课程理念提倡素质教育,素质教育中有一重要环节就是地理教学,高中地理知识的学习帮助人们拥有分析事物发展规律的能力.因而,作为高中地理解释,一定要进行教学创新,采用多样
居里夫人说:“我们应有恒心,尤其要有自信心!我们必须相信,我们的天赋是要用来做某种事情的。”来到这个世上,我们每个人都想在有限的生命历程中,展示自己生命的价值与意义。当我们为自己设定下人生的目标与志向时,我们就会满怀着激情,不断地奔向我们的梦想。   一旦开始,便不能终止。这就是坚持。   通向理想的道路,不会是平坦的,一定布满了沟沟坎坎,甚至荆棘与悬崖、激流与险滩。只要理想不倒,只要我们还在
本文选择重庆市作为乡镇债务实证研究的对象,在农村税费改革不断深入以及乡镇债务问题日严重的背景下,通过研究乡镇债务产生的历史过程,探究其形成的根源,以期为彻底解决乡镇债务
生物化学是医学院校的专业基础课程,说课是提高教师自身教学水平的一个重要手段.本文针对护理专业生物化学蛋白质的结构与功能这一节教学内容,按照说教材、说教学目标和教学
古语说天有不测风云.在自然灾害面前,人类的力量十分渺小,各种灾害带给人类的往往都是无穷的悲伤.雷电灾害属于自然灾害中常见的一种.受全球气候变化影响,我国极端天气事件增
本文致力于帮助求职者根据其目标应聘单位的情况,得到具有针对性的应聘流程及建议.首先,通过采访步入教师行业的陕西师范大学部分毕业生,将应聘时考察的教师能力分为五种:教
作为心理学领域的新兴科学,积极心理学倡导个体的积极品质的形成,这与大学生核心价值观教育的目地相契合,而且其研究思路和研究方法也对大学生核心价值观教育有着积极的促进