半连续数据下基尼系的统计推断及其应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:peachonly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基尼系数作为一个具有重要影响力的统计指标被广泛应用于衡量样本数据分布的集中程度或均匀程度,在日常的经济、社会与生活等方方面面都扮演着十分重要的角色。同时,在生物医学、生态学和经济学等领域的应用中,常常遇到半连续数据,即在零点离散取值而在正实数集上连续取值的数据类型。由于该类型数据具有大量零观测值和呈现偏态分布的非零观测值等特点,导致常见的参数分布不能完全拟合此类样本数据。针对此类半连续数据特点,本文首先提出使用一种非标准两成分混合模型对数据分布进行建模。在此模型基础上,得到了对基尼系数点估计的表达式,此结果表明若简单忽略零观测值的存在,将显著低估总体的基尼系数。其次,本文进一步考虑了常用的非参数方法构造基尼系数的置信区间,包括基于渐近正态、基于bootstrap重抽样和基于经验似然的方法,并研究了上述方法构建的置信区间在半连续数据和非标准混合模型下的适用性。最后,本文提出了一类更稳健的置信区间构造方法,通过对基尼系数使用logit和probit变换来进一步提高上述基尼系数置信区间覆盖率。通过大量蒙特卡洛数值模拟,本文发现在半连续数据中,bootstrap校准后的经验似然法构建基尼系数的置信区间对零观测值的占比和数据的分布更具有稳健性。但在零观测值占比较高、且样本量较小的条件下,经过logit和probit变换的bootstrap分位数法在置信区间覆盖率方面更具有优势。在实证分析中,通过构造实验组和对照组的住院费用和输血费用等指标的基尼系数点估计和置信区间,由此来判断治疗晚期结直肠癌患者的靶向抗体西妥昔单抗(Cetuximab)是否会影响医疗费用支出的差异程度。
其他文献
第三人利益合同相较于一般合同而言最为显著的特征便是使合同当事人以外的第三人取得合同权利。第三人利益合同制度的立法初衷在于保护第三人利益,所以整个第三人利益合同制度的设计均应从保护第三人利益的角度展开。围绕这一中心点进行制度设计时,应充分考虑第三人取得合同权利的法理基础及在审判实践中的具体适用问题。《民法典》的出台确实增加了第三人利益合同制度的规定,但也仅为初步规定。虽终结了理论界对该制度存在的部分
学位
胁迫行为是侵犯他人意志决定自由的违法行为,起先在民法中加以适用,随后引入到刑事案件中,被各国刑法规定为一项罪行。我国刑法分则中明文规定了许多以胁迫方式实施的罪名,但由于只是对胁迫行为进行列举性规定,导致很多严重的犯罪行为未被包含,司法实践中还存在很多由胁迫类犯罪引起的定罪量刑标准混乱的问题。本文将胁迫行为作为研究对象,旨在从立法方面完善对胁迫行为的规制。本文共分为六个章节对胁迫行为的刑事立法进行论
学位
智慧城建作为智慧城市的重要组成部分,其评价指标体系的构建是否完整将影响到智慧城市的建设效果。首先研究分析国内智慧城市评价指标体系的构建情况;然后基于安徽省城市发展现状,针对安徽省住建行业,构建和量化安徽省智慧城建评价指标体系,对安徽省部分省辖市进行评价计算和综合分析,结果显示,合肥市、芜湖市智慧城建评价属于三星级;最后对安徽省智慧城建评价进行总结与展望。
期刊
随着经济全球化的蓬勃发展,中国经济对外开放的程度也在不断加深。加入全球价值链,是中国对外开放的一个主要方式,企业通过从事加工贸易等生产活动以参与国际分工。近年来,中国在全球价值链中的地位也越来越重要,成为了“世界工厂”。与此同时,从绝对数值上看,中国的劳动力就业水平及劳动工资均在提高,然而,进入21世纪后,劳动力的就业增长率及劳动收入份额同时出现了下降。当前国内经济增速放缓,失业率水平不断提高,劳
学位
二维材料自问世以来就得到了学者们的广泛关注。作为其中典型的代表,过渡金属硫族化合物因其独特的半导体特性,有望被广泛应用于光电探测器、晶体管和发光二极管等领域。其中,二硫化钨(WS2)由于其较高的开关比、独特的谷极化特性、以及较低的亚阈值摆幅,在光电器件中有广阔的应用前景。虽然理论计算预测了WS2优异的电学性能,但是WS2基电子器件依然存在较高的肖特基势垒和较低的载流子迁移率等问题。为了解决这一问题
学位
在国家推进贸易高质量发展的背景下,本文主要研究了大学扩招带来的人力资本增长对于企业出口产品质量的影响,人力资本的增长有助于新技术的开发、对于国际前沿先进技术的学习吸收以及生产效率的提高,这都有助于产品质量的提升。借助于1999年的中国大学扩招政策作为准自然实验,利用双重差分法评估人力资本对于企业出口产品质量升级的因果效应。使用海关数据和工业企业数据,我们发现人力资本能有效促进企业产品质量的增长,2
学位
高维数据分析与建模是目前统计领域研究的热点之一,而方差估计则是统计建模中的一个基本问题。在维度远大于样本大小的高维线性回归中,由于设计矩阵的逆矩阵不存在,无法得到参数估计量,导致传统的方差估计方法通常并不适用。因此在高维数据研究中通常会先进行变量选择,使得变量个数小于样本量,以达到降维的目的,从而再进行参数估计和统计推断的工作。值得注意的是,在高维数据中噪声和一些预测变量之间存在着高度伪相关性,因
学位
<正>随着全球工业经济的迅速发展,对生态环境质量产生了一定的影响,出现了温室效应、土壤沙漠化、酸雨等环境问题,开展环境保护工作已刻不容缓。但仅依靠人力实现环境保护工作的目标任务效率不高,因此,人们将现代化智能信息技术应用于环境保护,利用智能技术与仪器进行环境质量监测、保护工作。在环境监测工作中,人工智能技术的应用主要体现在数据处理与分析方面。人们对大气环境进行监测,采集空气湿度、
期刊
由于在人工智能、健康监测及虚拟现实等领域均有广阔的应用前景,柔性可拉伸的多功能智能传感器受到科研工作者的广泛关注,通过将温度和应力等物理变化转化为电学信号对外部世界进行感知。本文致力于研究一种用于人体健康评估和植物生长监测的柔性仿生多功能传感器,希望能如人体皮肤一样感知外部温度和微小形变,同时兼具监测植物生长状态的功能。由于超薄、超轻和透气等性能,该传感器不仅不会影响皮肤运动和汗液蒸发,而且也不影
学位
草原向来是我国重要的生态屏障之一,长期以来为了追求更高经济效益而对草原资源利用的不合理使得草原的再生能力受到了严重的影响。在政策文件中的生态补偿通常以“生态保护补助奖励”的形态出现,其目的是通过封育禁牧、休牧等措施限制草原生产者一定利益的方式实现草畜平衡,在维持草原系统的生态平衡、让草原居民的环境权落到实处的同时,为此对环境友好型生产者进行补偿以鼓励、奖励这种行为。中国现在实行的有关草原生态补偿的
学位