非参数密度估计—直方图与分组核密度估计理论研究与应用

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:a9228144
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
概率密度函数是统计学的基本概念之一。假设从某一未知总体中抽取一定数量的样本单元,密度估计就是利用这些样本单元去拟合总体的概率密度函数,f(x)。密度估计包括参数密度估计和非参数密度估计,两者有着本质的区别。前者是假设样本来自某一确定的总体分布,只是总体分布的参数未知,如正态分布N(μ,σ2),通过样本估计分布的参数,μ和σ2,并以此得到总体分布的概率密度函数。非参数密度估计是指在不假定总体特定分布情况下,直接利用样本观测值估计总体概率密度函数,(f)(x)。常见的非参数密度估计方法有:直方图估计、频率多边形估计、平均滑动直方图,核密度估计,最近邻估计;等。   本文将首先介绍最为经典的非参数密度估计方法:直方图估计,系统阐述面向样本的最优直方图制作方法。然后,讨论条件分组核密度估计的基本内容,它拥有比直方图更好的估计精度。最后,在直方图和分组核密度估计条件下,利用误差平方和,定义直方图-分组核密度估计,以此提出一个新的最优直方图制作方法。   本文的特色和创新之处有以下几个方面:   1.本文系统阐述了直方图理论和最优直方图制作的最新研究成果,重点强调面向样本的直方图制作方法。   2.定义一个新的概率密度估计方法:条件分组核密度估计。它在数据分析和处理方面具有广阔的应用场合。   3.讨论了分组核密度估计的渐近性质。证明条件分组核密度估计拥有与核估计相同的均方收敛速度,且其计算简便,等同于直方图。还研究了分组核密度估计制作的Cross-Validation方法。   4.在误差平方和条件下定义直方图-分组核密度估计误差,讨论了其渐近性质。   5.比较直方图-分组核密度估计理论和直方图制作的Scott公式,提出一个更加稳健的面向样本的直方图制作方法。更加稳健的面向样本的直方图制作方法。   6.在遗传算法基础上,构建求解直方图和分组核密度估计的边界点和最优组距的优化算法,以此替代传统的穷举法,其优点是计算简便且能得到估计的全局最优解。本文还用Monte Carlo方法讨论了边界点和组距对误差平方和的灵敏度分析。
其他文献
自来水是民生必需品,为人类生活不可一日或缺,其重要性显得尤为重要,从长远形势考虑,保证水资源利用、保证水的质量以及成本的逐年提高造成公益性企业严重亏损,如何合理调整
由各类流感病毒导致的流感疾病已经逐渐成为全世界范围内最主要的健康威胁之一,H3N2流感病毒就是其中的典型代表,它能引发肺炎和呼吸道衰竭,甚至最终导致死亡,给人类健康带来日益严峻的挑战。由于H3N2流感病毒的疫苗株在不同的宿主媒介中培养扩增时会出现不同程度的适应性进化,尤其是在鸡胚中培养时会经历更加显著的适应性进化,导致疫苗功效下降,所以本文结合计算生物学和机器学习的方法,尝试对H3N2流感病毒的动
学位
教学是教与学相互作用的双边活动,是师生双向反馈、教学相长的过程.在教学活动中.教师是活动的主导,学生是学习活动的主人.教师在教的过程中的主导作用,只有在学生主动学习的
答集程序设计是非单调推理、演绎数据库和支持失败即否定的逻辑程序设计的交叉学科。答集程序设计的理念是用逻辑程序对问题进行编码,其中逻辑程序的答集对应于问题的解,然后通
在被誉为“信息时代”、“知本时代”的21世纪,信息技术高速发展,知识经济愈演愈烈;人们积累的各式各样的数据、信息爆炸式地增长;数据挖掘学科应海量数据处理的局势而生,举世瞩目
学位
分析了电子商务对中小企业扩大国内外市场、提高经济效益的作用,以及潍坊市中小企业电子商务发展状况,提出了促进潍坊市中小企业发展电子商务的对策。 Analyzes the role of
金塔县东坝镇西盛村是一个只有5个村民小组、182户、2154亩耕地的小村。2002年以来,该村党支部带领村民大力发展设施养羊业,迅速走出了一条区域化布局、专业化生产、规模化
本文主要研究非交换单群的6度弧传递Cayley图自同构群的结构和性质。在Cayley图的研究中,弄清其自同构群的结构对决定图的性质及结构极为重要。随着有限非交换单群性质及子群
为了解带有空间异质和个体运动对疾病持续性和灭绝的影响,研究了空间SIS反应扩散模型,重点研究了无病平衡点的存在性,唯一性以及渐近特征.首先,应用变分原理,线性化和Krein-Rutman
近年来,我国国内部门发达省份和地区,借鉴与参考欧美等国家构建公共图书馆总分馆制的策略,也初步建成了略有规模的公共图书馆总分馆制.但是受我国国情的影响,以及国内社会生