【摘 要】
:
随着科学技术快速发展,人们在医学、生物学、经济、工业等各个领域获得的数据信息呈指数式增长,数据维数越来越高。变量选择是一种非常有效的高维数据信息提取手段,但传统变量选择方法存在一定的缺陷。Cox比例风险模型是一个半参数模型,在生存分析中占有重要地位,但其应用范围被制约在低维数据中。本文将线性模型下DantzigSelector方法和自适应DantzigSelector方法推广到Cox模型中,并研究
论文部分内容阅读
随着科学技术快速发展,人们在医学、生物学、经济、工业等各个领域获得的数据信息呈指数式增长,数据维数越来越高。变量选择是一种非常有效的高维数据信息提取手段,但传统变量选择方法存在一定的缺陷。Cox比例风险模型是一个半参数模型,在生存分析中占有重要地位,但其应用范围被制约在低维数据中。本文将线性模型下DantzigSelector方法和自适应DantzigSelector方法推广到Cox模型中,并研究其在Cox模型中的性质。
本文给出了在Cox模型下各个变量选择方法(Lasso及其相关方法、DantzigSelector方法和自适应DantzigSelector方法)回归参数估计值的定义与求解思路。讨论了DantzigSelector方法在Cox比例风险模型中的性质,同时,还证明了自适应DantzigSelector方法在该模型下也具有Oracle性质。
为了验证在Cox模型下变量选择方法理论研究的有效性,通过数值模拟,生成Cox比例风险模型删失数据。本文主要研究了在高维数据和低维数据这两种情形下,分别考虑变量之间相关与不相关的条件下比较在Cox模型中各个方法的变量选择能力。从模拟结果来看,Dantzigselector方法和自适应DantzigSelector方法不管是在低维数据还是高维数据下相较于Lasso等其他方法来说总体拟合效果更佳,验证了其在Cox模型下解决高维数据的有效性和可行性,同时,改进后的自适应DantzigSelector方法的效果优于Dantzigselector方法。
其他文献
随着国民财富增长和居民理财观念的增强,金融资产投资需求越来越旺盛。但是随着金融市场发展的深化和外部经济环境变化冲击带来的不确定性增加,投资者面临越来越多不可预期的风险。相比于单一资产投资,大类资产组合投资可以更加有效地分散风险,提高收益。同时资产种类的增加与金融工具的丰富也为资产组合投资发展提供了有力保障。 本文通过对大类资产配置模型的梳理发现,均值方差法、等权重法及最小方差法等传统资产配置方法
噪声驱动的随机动力系统广泛应用于物理、生物、经济、化学等领域.描述随机动力系统的动力学行为具有重要的意义.现实中很多动力系统的精确解是很难得到的,而数值方法提供了刻画动力学行为的有效途径.布朗运动驱动的随机动力系统,由局部偏微分方程刻画.但是,当波动是突发事件时,采用高斯噪声模拟此行为是不恰当的.在这种情况下,利用非高斯噪声驱动的动力系统来模拟具有重尾和带跳样本路径的随机波动现象更合适.非高斯的动
外商直接投资技术溢出被认为是最重要的知识溢出。政策决策者和学者—特别是在发展中国家和转型经济体—普遍认为吸引外商直接投资对本国经济发展非常重要。他们认为,外商直接投资可以带来急需的资本、管理技能和现代技术等。更重要的是,来自外商直接投资的技术溢出效应,有助于提高本国企业的生产力和竞争力。已有文献中主要区分了三种类型的外商直接投资技术外溢效应:(1)外商直接投资对同一部门的东道国企业的横向(水平)技
本文主要研究几类离散时间随机系统的最优控制问题,全文共分为8章.第1章主要介绍随机最优控制理论的历史背景及国内外研究现状,并简要 概括本文的主要结果. 第2章研究了离散时间不定平均场随机线性二次最优控制问题.对于有限时域问题,我们刻画了开环最优控制的存在性.然后,通过线性矩阵不等式条件,证明了不定线性二次问题是适定的当且仅当广义差分Riccati方程可解.针对无限时域问题,利用最大解设计了线性
真实世界中的大多数复杂系统都不可避免地受到了随机扰动(噪声)的作用.在这些干扰下,动力系统展示了很多有趣的现象,如亚稳定(metastable)状态之间的跃迁、随机共振以及小孔逃逸等.理解和描述随机动力系统的动力学行为具有重要的实践意义.随机微分方程则是描述随机系统的合适数学模型,而其构建需要考虑模拟随机因素的噪声项.高斯白噪声是一类简单而又常见的噪声.而非高斯L′evy噪声更为广泛,并且逐渐得到
“一带一路”和蒙古国“草原之路”倡议对接以及“中蒙俄经济走廊”的建设为中国与蒙古国的矿业投资和经贸合作创造了良好机遇。在目前的国际形势下,中国需要与资源丰富的国家在自然资源开发、贸易、投资等领域建立合作机制。蒙古国与中国在资源需求与供给方面具有较强互补性,探索如何与其建立良好的合作伙伴关系是非常必要的。 在此背景下,本文结合矿业对外直接投资(Outward Foreign Direct Inve
最低工资制度是各个国家政府调节劳动力市场的主要政策措施之一。我国原劳动部1993年出台了《企业最低工资规定》,并在2004年颁布新的《最低工资规定》,标志着最低工资制度全面实施。最低工资政策是否以及如何作用于实体经济,即最低工资政策影响公司行为的机制和后果问题在学术界得到广泛关注。长期以来,我国中小企业在很大程度上依赖粗放型增长方式和人口红利促进经济增长,最低工资制度的实施使这一状况面临的挑战日趋
行为金融和适应性市场假说(AMH)认为,金融市场具有可预测性,投资者能够通过技术分析、基本面分析等手段获取部分超额收益。为了对金融时间序列进行预测,学者们提出了两类预测方法,即传统计量分析方法和机器学习方法。由于金融时间序列中具有的高噪声、非平稳、非正态分布等特点,基于严格假设的传统计量模型很难对金融时间序列进行准确预测。与传统计量分析方法不同,机器学习方法能够对金融时间序列中的复杂结构,以及变量
“经济状态”取决于许多相互依赖的大企业的行为(生产力和投资行为等等),而大企业在经济稳定中发挥着举足轻重的作用,因为经济中存在着“粒度特征”(Granular effect)。“粒度特征”是指:企业规模为幂律分布的特征,即肥尾的特征——少量大型企业与大量小企业共存。这种特征会使中心极限定理失效,大企业异质性冲击在总体上不会相互抵消,即便是个别企业发生倒闭或困境事件,也极易演变为系统性风险。特别是系
众所周知,在现如今大数据的时代背景之下,信贷数据的来源十分复杂,除银行记录外,信贷数据还包含各种社交数据、电商数据、运营商数据以及其它金融机构的信用数据等,不仅数据种类繁多,还普遍存在数据缺失严重、数据异常等问题。因此,如何来应对严重的数据稀疏问题,已经成为了消费信贷大数据风控中的一个难题,而如何从这些海量信用数据中挖掘出那些被隐藏的信息进而对消费者的信用状况进行评估也成为了一项颇具挑战性的任务。