基于高斯过程算法的倾向性评分值估计新方法研究及其应用

来源 :2016年中国生物统计学术年会 | 被引量 : 0次 | 上传用户:a13600660175
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  目的:研究倾向性评分值计算的新方法,用于控制观察性数据中混杂因素.方法:首先,基于蒙特卡洛模拟样本,用不同核函数构建高斯过程模型,比较筛选最优核函数;分别基于模拟数据和实例数据,应用高斯过程模型和logistic回归进行倾向性评分计算和匹配,计算不同处理效应估计值的相对偏倚和ROC曲线下面积比较两种方法的性能,标准化差异值用于比较匹配后混杂因素变化情况.结果:模拟数据下基于高斯径向基核函数高斯过程模型性能优于其他核函数;模拟样本量分别为200,500,1000和2000时,高斯过程模型进行倾向性评分匹配后的样本量比基于logistic回归得到样本量分别多4.8%,7.8%,5.2%和2.1%;不同模拟样本量下高斯过程模型得到的ROC曲线下面积均值大于logistic回归模型的ROC曲线下面积,前者模型的相对偏倚绝对值小于后者.实例分析中基于高斯过程的倾向性评分匹配协变量的标准化差异值均小于0.1.结论:基于高斯过程算法的倾向性评分值计算及匹配能有效控制混杂因素.结合高斯过程模型的倾向性评分方法作为处理观察性研究中混杂偏倚的有效工具,具有良好而广泛的应用前景.
其他文献
居住在养老院的老年人与居住在社区的老年人相比,由于生活环境的不同两者间的生活满意度具有差别,但不同性别间的老年人的生活满意度可能会有更大的差异存在.本研究旨在调查中国养老院老人的积极生活取向水平、分性别探索影响其积极生活的潜在危险因素.
中国传统的以家庭为基础的支持系统的改变导致更多的老人可能选择养老院作为他们的养老住所.本文的目的是为了探索生活在养老院的老人中,子女探视和老人的自我意识对其积极生活定位的影响.调查了中国东北部60所养老院2355名老人.社会人口学特征以及与子女相关的因素都被记录下来.积极的生活定位通过使用包含6个问题的生活定向量表来测量(LOS).子女相关因素和积极生活定位之间的关系通过调整了年龄、性别、教育程度
在线性混合模型框架下探索基于重抽样方差成分的然比检验多位点关联分析方法.首先假设SNP位点效应为随机的,服从共同的正态分布,将多位点关联分析转化为对随机效应的检验;然后通过似然比检验和限制似然比检验来进行方差成分检验,采用重抽样方法包括置换法、非参数Bootstrap法获得似然比统计量的零分布,最后进一步通过混合分布来近似重抽样统计量的零分布以提高计算速度.
肿瘤临床试验一般以总生存时间或无进展生存时间等生存资料作为主要疗效指标,其观测存在删失,是其重要的特征之一.有研究表明,过高的删失率将导致疗效评价的检验效能降低.但组间删失率水平不同的情况对疗效评价产生何种影响尚无定论.因此,本文旨在探讨肿瘤临床试验中疗效指标组间不同删失比例情况下疗效评价的统计学性质.
The more often used Tangos score confidence interval (CI) and the more recently proposed rank-based nonparametric CI are utilized for proportion difference on paired data.However, the confidence width
背景与目的:慢性阻塞性肺病(COPD)属于世界范围内的慢性呼吸道疾病,是以气流受限和不完全恢复的肺功能下降为特征的缓慢进展性疾病,其发病率和死亡率呈上升趋势,已经成为中国越来越关注的公共卫生问题.为探究COPD住院支出费用快速增长的原因,研究2009-2013年天津市参保慢性阻塞性肺病患者住院总费用的内部影响因素及其发展趋势,为控制医疗费用过快增长提供参考依据.方法:采用新灰色关联法定量分析住院各
针对独立左截断右删失数据,现有的非参数估计法,如左截断Kaplan-Meier估计法(KM)、非参数极大似然估计法(NPMLE)和Breslow-Fleming-Harrington估计法(BFHE)等都对小风险集敏感,生存率估计值会出现突然降为0的情况,本文提出提高估计精度的非参数估计法.
Background: The identification and inference of path-specific effects along a selected subset of edges in complex network are very important in practical causal reasoning about legal, medical, public
会议
目的:基于多维指标构建治疗质量综合评价模型,探讨模型估计治疗质量的有效性;综合评价医院、医生乳腺癌的治疗质量。方法 构建两参数logistic潜变量模型作为测量模型,将测量模型中的潜变量作为因变量整合进多水平结构模型,设定虚拟水平代表多维潜变量,构建多水平结构模型。应用MCMC估计模型参数,拟合三水平二维模型分析实例数据。结果 建立了多水平多维潜变量模型;模拟研究结果提示,评价指标数及医生数均为2
Objective The quadratic inference function (QIF) method becomes more acceptable for correlated data because of its advantages over generalized estimating equations (GEE).This study aimed to evaluate t