双重删失下变系数Cox模型的变量选择

来源 :云南大学 | 被引量 : 0次 | 上传用户:xujin2003cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双重区间删失数据常见于医学、流行病学,经济学等领域,是生存分析研究中一种重要的数据类型。比如在艾滋病定群研究中,对被输入污染血液的血友病患者进行了间歇性观测,该研究的目的是确定病人被输入污染血液的量的多少对艾滋病潜伏期的影响,而艾滋病的潜伏期需要通过感染HIV-1和患艾滋病两个事件来确定,但是在研究中这两个事件均不能被直接观测,只能确定其发生的区间,于是就产生了双重区间删失数据。目前大多数学者针对双重区间删失数据的研究主要集中于参数估计问题,而关于双重区间删失数据的变量选择问题的研究还相对较少。因此,本文将研究双重区间删失数据下Cox比例风险模型的变量选择问题,其研究内容如下:一、针对Cox比例风险模型,通过Bernstein多项式来近似基准风险函数,将其参数化。基于此,推导出双重区间删失下的似然函数,然后采用BAR(Broken Adaptive Ridge)方法来对变量进行选择。为了简化计算复杂度,本文结合Newton-Raphson方法与迭代最小二乘,将变量选择的惩罚似然转化为最小二乘估计的问题,从而实现变量选择。然后通过数值模拟和实例分析来验证本文所提方法有效性和可行性,模拟结果显示相较于本文中其他的变量选择方法,BAR方法在选择变量时较稳定,并且MMSE最小,错误选择变量个数最少。二、针对变系数Cox比例风险模型,采用B样条来近似时变系数,Bernstein多项式来近似基准风险函数。基于此,推导出双重区间删失下变系数Cox比例风险模型的似然函数。采用AGLasso(Adaptive Group Lasso)来构造似然函数,然后使用迭代组Shooting(Iterative Group Shooting)算法来对惩罚函数进行优化,从而实现变系数Cox比例风险模型的变量选择,获得重要变量,通过数值模拟和实例分析验证该变量选择方法的有效性和可行性,结果显示在不同样本量,不同参数个数以及不同删失率下,本文提出的变量选择方法能够以较高概率正确的选择出重要变量。与BAR方法相比较,AGLasso方法选择变量的正确率更高。最后,本文给出了总结和对未来拟做的研究内容。
其他文献
《爱的痛苦》是华裔美国作家雷祖威(David Wong Louie)于1991年出版的第一部短篇小说集,共收录了 11篇故事,有的故事涉及到新一代华裔群体,还有一些涉及的则是族裔身份模糊的美国人。许多人认为,这部小说与之前的美国华裔作家作品相比弱化了族裔性,但笔者仍发现小说体现出了华裔身份的特殊性。与此同时,作品展开了对于其他主题的叙述,如对美国人的生存状态的关注,这也是此前的华裔美国文学作品所缺
学位
UiO-66-NH2和MIL-101-NH2(Fe)已广泛用于去除水体中的磷酸盐和As(Ⅴ),但UiO-66-NH2选择性差,去除效率低,而MIL-101-NH2(Fe)稳定性较差,选择性和去除效率也不能满足实际的需求。为了增加此类MOFs材料的吸附性能,增强其实用性,本文通过了稀土元素钕(Nd)掺杂到UiO-66-NH2和MIL-101-NH2(Fe)中,制备了Nd-UiO-66-NH2和Nd-
学位
大数据时代中的网络平台产生了样本量巨大反映情感信息的短文本,获取和理解短文本中所蕴涵的信息是非常有意义的。但由于文本数据的结构特征和短文本包含词量较低,使得网络短文本聚类面临以下主要问题:1.基于单词向量空间模型获取的词向量维度等于文本数据词表的长度,使得词向量维度过高而带来的短文本的高维问题;2.网络短文本中包含的关键词的频数较小,关键词的词频和关键词之间的共现频率等语义信息不能得到充分挖掘导致
学位
传统聚氨酯材料的发展可以追溯到20世纪40年代,在过去的几十年中,对聚氨酯的研究已经比较成熟,聚氨酯材料凭借优异的机械性能和耐磨性等优点获得了广泛的应用。但是因为其耐水性和耐候性不佳,从而限制了其在某些领域的应用。有机聚硅氧烷独特的结构使其拥有优异的耐高低温、耐候性和透气性等性能。本论文研究将聚硅氧烷的优势性能和聚氨酯优异的机械性能结合制备二者兼备的聚硅氧烷-聚氨酯弹性体和聚硅氧烷-聚氨酯泡沫,并
学位
随着大数据,精准医疗、个性化营销的快速发展,数据的异质性及变量的稀疏性是建立模型分析数据需要考虑的两个重要因素,探究分析这类型数据的变量选择、亚组分析、参数估计方法是十分重要的。首先针对纵向、缺失异质数据,本文研究了带有缺失、纵向数据的异质性回归模型。在频率学框架下,通过多向分离惩罚函数与逆概率加权相结合,采用ADMM算法解决模型的参数估计、变量选择及亚组识别问题,特别地,本文所提出的方法实现了个
学位
新媒体的快速发展成功打破线上线下边界,因其在传播上任意切换、随时进入的特点,最大限度地利用了用户碎片化时间,渗透进大众的日常生活。2017年,我国短视频行业以迅猛的势头迎来了风口爆发。短视频成功链接多元场景,在多领域交叉渗透,承接更多资源,已然打造了一种新的互联网生活方式。同年五月,以中资企业现代传播集团的收购为契机,专注于荟集艺术短视频的国际化平台NOWNESS成功进入中国市场,并站稳脚跟。作为
学位
环境内分泌干扰物(EDCs)是一类对人体生殖和发育造成严重损害的外源性物质。其中,17α-乙炔基雌二醇(EE2)和17β-雌二醇(E2)为最典型且雌激素效应最强的人为和天然EDCs,已广泛存在于水体中。伴随着人们对环境保护的愈加重视,以高效绿色的方式去除EDCs成为了人们迫切的期望。近年来,可见光催化降解有机污染物以高效、环保、毒害小、多功能和成本低等特点成为了备受关注的新型水处理技术。本论文以E
学位
本文研究基于Copula函数构建的关于即有离散型又有连续型的多个响应变量的回归模型。这种多变量方法允许通过考虑多个响应变量之间的联系,共同估计它们的回归参数。它通常比从单独分析中获得的估计值更精确。当响应变量的个数大于两个且存在尾部相关等复杂相关关系时,使用多元高斯Copula连接响应变量具有局限性。因此本文将采用更加灵活的因子Copula函数来刻画响应变量之间的相依关系。由于需要估计因子Copu
学位
投融资是实现企业增值、保证企业长远发展的基石。在不同程度的研究假设前提下,企业投融资理论一步步发展,与现实世界联系更为紧密的行为金融学成为学者们研究的热点。一方面,资本市场上投资者情绪会导致股票价格失去其反映基本价值的作用,管理者据此所进行的融资决策会影响到企业的投资规模。因此投资者情绪通过什么渠道影响企业投融资规模是本文想研究的一个问题。另一方面,民营企业正“量入为出”的谋求稳定发展的同时,国有
学位
快销行业,也称为快速消费品销售行业,快速消费品是指消耗速度快,使用寿命短的消费品,生活中的日常用品很多都是快速消费品,包括日化用品、食品、烟草、医药等。由于快速消费品在日常生活中会被大量消耗和高频率复购,因此快速消费品销售行业依赖大规模市场来获取利润。目前,快速消费品行业已经发展为全球第一大产业,为充分发挥国内消费市场优势,振兴实体经济,通过搭建快销行业品牌商家数字化终端积分体系,开展线下消费线上
学位