有限混合模型的模型选择研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:davidfeng2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相较于单个参数模型,有限混合模型能够更好地刻画来自多个子总体的异质性数据的分布特征。在很多实际问题中,混合模型的真实成分个数通常是未知的,从而给模型的统计推断带来困难。一般情况下,更容易得到混合模型成分个数的上界,但是基于这种扩大的模型进行参数估计存在一些问题,包括:参数缺乏可识别性、费希尔信息矩阵退化以及真实的模型参数位于参数空间的边界。针对这些问题,本文研究了混合模型参数估计的收敛速度以及成分个数的一致估计。除此之外,关于混合回归成分是超高维情况的研究较少。因此,文中将进一步研究成分个数未知情况下超高维混合回归模型的模型选择问题。在成分个数未知情况下,许多学者针对混合模型的参数估计问题进行了研究。Redner(1981)[1]和Feng and McCulloch(1996)[2]分别证明了极大似然估计的一致性,但均未给出具体收敛速度。Chen(1995)[3]在考虑了糟糕的情形后,提出最优的极小化极大收敛速度是n-1/4。Khalili and Chen(2007)[4]表示基于成分个数的一致估计,可以得到参数估计root-n的逐点收敛速度。在第二章中,本文着重考虑了没有真实成分个数信息时,如何保证参数估计的收敛速度,并提出了一种惩罚似然方法,该方法对不同成分中成分参数间的距离施加惩罚。文中证明了该惩罚估计能够落入参数空间中不可识别子集的非退化区域,从而保证了费希尔信息矩阵沿着特定方向的正定性。同时,文中证明了该估计能够以root-n的逐点收敛速度收敛到真实参数空间的经济子集,这与传统的极大似然估计收敛速度一致。此外,文中提出了改进的EM算法用于最大化惩罚对数似然函数,并通过泊松混合和正态混合四个数值模拟展示了估计方法在有限样本情况下的估计效果。虽然,第二章提出的惩罚似然方法能够保证冗余成分的混合比例估计值很小,但仍然无法实现模型的成分选择。由于该惩罚估计收敛于真实参数空间的经济子集,本文在此基础上,进一步对混合比例施加惩罚,确保冗余成分的混合比例能够被一致地估计为零。此外,文中还研究了为实现混合比例稀疏估计,惩罚函数需要满足的条件。根据得到的稀疏条件,文中揭示了一些常用的惩罚函数之间的差异,并解释了有的惩罚函数(如:Lasso和SCAD)无法得到令人满意的结果的原因。混合模型成分选择的一致性以及参数估计的渐近正态性均在文中给出。此外,针对所提出的惩罚似然方法,文中给出了相应的EM算法,并证明其具有上升性质。数值模拟和实证分析进一步展示了惩罚方法的有效性。在第四章中,我们将模型选择问题拓展到了超高维混合回归模型。针对此问题,本文提出了一种惩罚估计方法-两步过程。首先,在模型成分个数未知的情况下进行成分选择。然后,基于第一步的成分个数估计结果进行参数估计,将变量选择应用于超高维回归模型。同样地,文中给出了特定的EM算法用于最大化惩罚对数似然函数。我们通过数值模拟展示惩罚方法的有效性。此外,关于净资产收益率(ROE)预测的实证研究也充分展示了模型在有限样本下的估计效果。
其他文献
科学文献是科研工作者分享研究成果的学术交流过程,而引文则是关联这些研究成果的主要途径。科学工作者通过引文表达对他人研究成果的认同,提供原始知识源,获得同行支持,还能在其中表达他们的想法和意见。这些想法和意见是非常宝贵的学术资源,科学引文的情感分析旨在了解作者对科学引文的想法和意见。科学文献中的引文情感,通常被认为是中性的,要么是客观地描述了一种算法或方法,要么是被用于支持事实或陈述。这可能是作者为
学位
随着科技的发展,各种机械设备的小型化轻量化成为一种趋势,微机电系统受到人们的广泛关注。传统的微机电系统主要由压电驱动器,电磁驱动器,电热驱动器和静电驱动器等核心驱动部件组成。然而,这些驱动设备往往离不开复杂的能量转换和传动系统,给设备整体的微型化带来很多困难。近年来,光致形变效应,即光致非热效应引起的形状变化,重新引起了人们的关注,成为传统机电致动器/传感器的替代解决方案。它具有光能直接转化为机械
学位
随着化石能源的快速枯竭和环境污染的日益严重,开发清洁的可再生能源已成为社会可持续发展的当务之急。而常见的可再生能源如太阳能具有间歇性和空间分散等缺点,因此可再生清洁能源的高效转化与存储就成为全世界研究机构关注的焦点。其中,探索安全高效的电解水制氢能量转化技术和锂离子电池能量存储技术成为全球科学家的研究热点。但是,现有能量转化与储存材料存在活性低、稳定性差和成本高等问题。针对这些挑战,本论文以地球储
学位
宏观经济不确定性是度量经济系统不可预测程度的重要指标,2008年金融危机以来吸引了学界的普遍关注。宏观层面,宏观经济不确定性可改变政策执行效果,影响产出、投资、消费等多个方面;微观层面,宏观经济不确定性影响企业投融资决策和家庭资产配置。因此,宏观经济不确定性的相关研究对宏观金融政策制定者、企业和个人投资者均具有重要的理论和现实意义。研究宏观经济不确定性需首要解决如何测度宏观经济不确定性的问题。关于
学位
在气候问题日益显著的当下,碳减排成为世界各国共同关注的焦点。我国多次在国际会议上作出庄严的承诺,显示出了坚定的减排决心,也充分体现了大国担当。2020年9月22日,在第75届联合国大会期间,中方提出将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和。碳减排是一项系统性的工程,考虑到我国地区间经济发展水平和资源禀赋的显著差异,基于
学位
控制图作为统计过程控制领域最重要的方法,在工业生产、疾病防治、地质监控等领域有着广泛的应用。受限于历史样本容量大小、理论研究基础和计算复杂度等因素,传统的统计过程控制图研究通常基于固定的历史样本观测和固定的参数估计来开展。而随着工业大数据理念的跟进、数据采集和数据分析技术的提升,待监控的数据流普遍呈现“形式复杂化”、“特征动态化”等样态。“固定化”设计的控制图已无法完全满足实际生产领域的监控需求,
学位
基于学习者为满足取得佳绩的期望和需求而调动情绪的倾向和学习者所认同的学习策略之间的差异的教学具有非常重要的作用。因此,为了往后的深入学习,有必要理清学习策略和语言学习策略的概念。技巧是学生实现目标的工具,也是学习策略的一部分(Derry,1990 and Schnotz,1994)。而语言学习策略是综合目标语言、学习者自身特点和其他方法的较为宽泛的概念(Ehrman,Leaver,and Oxfo
学位
进入21世纪,人工智能、大数据、云技术、生物技术等各项重大技术几乎在全球各个领域掀起了波澜壮阔的巨变,驱动着社会诸领域发生根本的变革。在教育领域,人工智能的全方位渗透激发了人们对未来学校的无限想象,更引发人们对未来学校的关注与热议。自从微软公司资助的“未来学校”在费城播下种子之后,以未来学校命名的会议、项目、计划迅速向全球蔓延开来,世界各国纷纷启动信息技术“重建”学校教育的行动。在此背景下,未来学
学位
从晚清开始,新旧思想驳杂,中西文化冲突强烈,在传统思想与现代文明交织的多元价值社会里,五四新文学先驱者之所以激进而又坚定地站在了新文学的阵营里,与他们的知识系统有着密切的关系。五四新文学先驱者的知识系统是新文学发生的主体性因素,是主体创造力的重要来源。因此,本论文从五四新文学先驱者多元化的知识类型、五四新文学先驱者的知识的现代性转变、五四新文学先驱者的知识对其思想与文学创作的作用、五四新文学先驱者
学位
复杂网络研究作为新兴的学科方向之一,极大地吸引了来自不同学科研究人员的广泛关注。针对复杂网络的定性和定量研究,有助于揭示复杂网络的潜在特征以及复杂系统中普遍存在的一般规律,在生物医药、社会科学、金融工程等诸多学科中具有重要的学术和实践意义。复杂网络的社区结构划分是有效降低复杂系统复杂性的方式之一,它有助于人们更好地分析和认识复杂系统中个体组织特性的结构,更加深入地理解复杂系统的演化机制,是人们改进
学位