基于分位数的部分线性单指标可加模型的变量选择

来源 :浙江财经大学 | 被引量 : 0次 | 上传用户:zhubajie527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半参数模型由于同时具有非参数模型的变通性和参数模型的可解释性,近年来,在统计学研究中日益流行。其中,部分线性可加模型(partial linear additive model,PLAM)是半参数模型中较为常见的一类模型,因此对该模型的研究也越来越多。另外,自分位数回归和变量选择方法提出以来,由于其估计的稳定性和优良的估计效率,得到了迅速的发展。分位数回归是从不同的角度分析数据,能够有效解决数据中存在的异方差问题,变量选择则是在模型稀疏假设下,寻找系数有显著效应的变量。所以,本文将分位数回归和变量选择应用到部分线性可加模型当中,用来分析各个因素对医疗费用数据的影响,并适当的提出建议及解决方案。对医疗费用数据的研究一直以来是卫生医疗行业研究的重点,医疗费用关乎最基本的民生问题,对其进行研究也是保障社会医疗体系公平的重要举措。实际中,由于医疗数据的不完整性以及其自身的复杂相关性,使得对它的研究存在一定的困难。医疗费用数据通常具有严重右偏,异方差,非正态等特点,通常情况下,收集到的医疗费用数据具有一定的稀疏性,所以传统的模型和方法不再适用该类数据。本文提出用部分线性单指标可加模型对医疗费用数据进行建模,再结合分位数回归和变量选择的方法对其进行分析,可以有效地解决医疗费用数据中存在的异方差性和稀疏性等问题。在对医疗费用数据的分析中,本文分为两部分对其进行分位数回归以及变量选择的分析,具体如下:第一部分:本文提出了用最小化平均分位数损失估计的方法来实现部分线性单指标可加模型的分位数回归,首先提出基于核函数构造参数部分的分位数回归意义下的相合估计以及非参数的渐近估计,在此相合估计和渐近估计的基础上,采用局部多项式回归通过迭代的方式进一步得到另一参数和非参数函数的估计,该估计可达最优收敛速率。第二部分:基于第一部分分位数回归该部分进一步地提出对部分线性单指标可加模型进行变量选择,模型采用自适应LASSO惩罚项进行系数压缩,算法则是采用最小角回归算法(LARS),并且证明了自适应LASSO惩罚项变量选择的Oracle性质,Oracle性质主要包含两个方面,一是变量选择的相合性,即当样本量n趋于无穷时,选择出真实模型的概率趋近于1,二是参数估计结果具有渐近正态性。另外,本文对上述所提方法和模型给出了相应的数值模拟以及渐近性质,一方面,从估计结果来看,通过模拟实验发现文中给出的估计方法都具有良好的性质,分位数回归方法得到了良好的估计结果,同时得出自适应LASSO的变量选择方法对于处理稀疏性变量数据具有一定的优越性。另一方面,从计算效率来看,分位数回归方法中的局部多项式求解最终转化为对相关线性模型的求解问题,极大的提高了运算效率。实例分析部分,我们提出将部分线性单指标可加模型运用到慢性心力衰竭(CHF)患者的临床医疗研究中,该数据记录了患者每次到医院就医的情况,研究对象年龄都超过60岁,通过对该数据分位数变量选择我们发现非患病服务情况在各个分位水平下效果都十分显著,种族因素也随着分位水平的提高影响效果逐渐显著,年龄和死亡情况在一定分为水平下有影响效果,而性别和追踪时间在任何分位数水平下对医疗费用基本没有影响。综上所述,本文提出将分位数回归和变量选择的方法应用于部分线性单指标可加模型中能够有效的对医疗费用数据进行统计分析。
其他文献
青礞石(Chloriti Lapis)为常用的矿物类中药,临床可用于治疗癫痫,疗效确切。然而,其治疗癫痫的效应机制及物质基础尚不明确。近年来,本课题组对青礞石成分、质量控制技术、药
在国家加快推进治理体系和治理能力现代化的大背景下,城市社区服务发展正在迈向新时期,从人的基本条件满足升级到全方位需求满足的服务。同时,随着烟台市城市化范围持续扩张,大批农民定居城市,关系复杂、诉求多元,提升政府基层治理能力和公共服务供给质量效率迫在眉睫,而社区服务作为最具体的补足政府部分功能的角色,肩负着重大责任,也提出了新的更高要求,迫切需要构建一个系统合理的城市社区服务体系。本文运用新公共服务
相对于简单的截面数据模型,面板数据模型有着明显的优势,因此越来越受到经济学、社会学、环境学等各领域的重视.在面板数据模型的整体理论框架中,非线性面板模型有着十分重要
随着互联网技术的发展及普及率的提高,互联网营销应运而生并迅速发展。互联网行业在快速增长的同时,应用模式也在不断的创新。互联网营销之所以以互联网(包括移动互联网)作为
随着能源危机和环境污染两大问题的日益突出,寻找一种新型、高效、清洁的能源越来越成为当前社会所面临的重要问题。氢能因具有无污染、热值高和燃烧清洁性等特点被认为是最有前景的可替代能源。光催化分解水制氢技术被认为是一种理想的、清洁的、高效的制氢途径,探索开发具有可见光响应的高效、稳定的光催化材料成为该领域的研究重点和技术难点。研究表明,2D/2D异质结复合材料不仅能有效促进光生电荷载流子的分离,还能为反
球磨机是对生产原料进行粉磨加工的关键设备。由于缺乏有效的检测手段获取球磨机的负荷状态,因此对球磨机工作状态的调整缺乏可靠依据。实际生产过程中,球磨机大多工作在效率
在日益激烈的市场竞争环境中,客户成为各大产品制造商竞相追逐的重要资源。为了吸引客户并留住客户,制造商必须准确的挖掘出客户偏好并快速响应客户需求。通过让客户直接参与到产品设计过程中,交互式遗传算法可以有效的解决这一问题。然而,由于人需要与计算机进行频繁的交互来给出个体的适应值,随之产生的用户疲劳问题成为了该方法的在实际中进一步发展和应用的瓶颈。为此,在交互式遗传算法的基础上,本文构建了基于模糊相对适
烷基硫醇分子吸附在Au(111)面,很容易形成高度有序的二维自组装分子薄膜(SAMs)结构。其在研究分子器件,分子传感器领域具有很大潜力是分子表面结构研究领域的热点问题。为了
含有六价铬(Cr(Ⅵ))、苯酚的废水不仅来源广泛而且毒性大,严重威胁人类健康和生态安全,因此研究开发高效的含Cr(Ⅵ)和含酚废水处理方法具有重要意义。吸附法由于其价格低廉和
云制造是一种面向服务的、高效低耗的网络化制造新模式。随着云计算技术的快速发展和应用,云制造平台汇聚了大量功能属性相同或相似但非功能属性不同的制造服务。由于用户需