非正态及非线性重复测量资料分析模型及其医学应用

被引量 : 21次 | 上传用户:liongliong540
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
重复测量资料是指对同一受试对象的某个或某些指标进行多次观察或测量获得的数据,在医学研究领域极为多见,观测指标的类型也多种多样,表现为定量变量,分类变量及等级变量;例如,在Ⅱ期高血压病的疗效评价中,为患者定期检测血压(包括舒张压/收缩压等)值为定量变量资料;在乳腺增生患者的治疗中,定期记录患者治疗期间的变化,检测指标为是否有改善的二分类变量;在介入治疗冠心病患者出院随访研究中,分别检查并记录出院时、出院后3月、6月和9月的疗效,不同时段结局可以是痊愈、好转、有改善、变化较小或无改变等,表现为等级分类变量;在一些情况下,记录的反应变量为计数数据,如单位时间(年或月)内癫痫发作次数。据反应变量与自变量参数之间的关系,又可分为线性重复测量资料模型和非线性重复测量资料模型;如定期监测高血压病患者的血压值,探讨患者血压与时间变量及其它解释变量间关系,可以用线性模型来拟合,称其为线性重复测量资料模型:在药动学研究中,个体口服一定剂量药物后连续采集检测血样中药物浓度,描述药物在体内吸收、分布、排泄的药动学过程,大多情况下表现为非线性特征,如Ⅱ室模型;在HⅣ病毒动力学研究中,血液里病毒粒浓度的定量分析是检测HⅣ感染者“病毒”路径,描述感染特征的一种常规手段,采用系列微分方程描述免疫细胞的繁殖、感染和凋亡以及病毒颗粒的繁殖和清除等特征的变化等,均可收集到非线性重复测量资料,要描述解释变量与反应变量参数间的非线性关系,可构建非线性重复测量资料模型。复发事件数据指同一个体在一段时间里多次经历同一事件,例如一名冠心病患者在一段时间内经历多次冠心病的发作,一名癌症患者在化、放疗后再一次次经历复发等,该资料具有重复测量和生存分析数据的特性。上面提及的资料均不满足经典线性模型分析要求的正态性和线性条件。重复测量资料线性模型理论已经成熟,应用也较普及,线性混合效应模型被视为最理想的方法。它可假定方差-协方差具有某特定结构形式,用来说明异方差性和相关性,既不像单变量分析方法那样严格,也不如多变量方差分析那样对协方差完全无约束;分析观察时点可相等或不等,能充分利用含有完全随机缺失观察值的资料,建模灵活。但对于非正态及非线性重复测量资料模型分析理论及应用目前尚处于初级阶段,有待于进一步完善相关理论,在医学研究领域推广、普及和应用。线性混合效应模型允许反应变量来自指数家族任一分布,包括离散分布(如二项分布,泊松分布等)和连续分布(正态分布,beta分布和卡方分布等),用连接函数将反应变量的均数与个体的线性预测值联系起来,构建广义线性混合效应模型(当随机效应不存在时退化为广义线性模型)和非线性混合效应模型,用来处理非正态、非独立二分类,等级多分类及计数重复测量资料。脆弱模型是用以描述子组中个体“生存”情况与时间之间关联性的一种模型,将随机效应、变量间的联系及未观测到的异质性引入到生存分析模型中,为复发事件数据高效方便的分析提供了新思路。重复测量资料类型广泛,医学应用非常多见。本文深入全面地从反应变量的类型(定性、定量、等级变量)来探讨相应的统计分析模型,并进行比较分析;从反应变量与解释变量参数之间的关系,系统探索线性模型和非线性模型。其主要内容分七部分:第一部分介绍重复测量资料的特性及其方差协方差结构。第二部分介绍线性混合效应模型重复测量资料统计分析基础理论。第三部分介绍广义估计方程(GEE)理论及其在二分类、有序多分类变量和计数重复测量资料分析中的应用。广义估计方程是边际模型估计方法的一种,是在广义线性模型和纵向数据准似然估计的基础上发展起来的一种拟似然估计方法,可用于非独立重复测量数据分析:它是在未完全指明个体观测的联合分布,仅根据(单变量)边际分布似然和个体重复测量向量的“作业”相关矩阵进行参数估计的,是一种半参数方法。即便在时间依赖协方差矩阵误指时,GEE方法也可得出一致和渐近的正确估计,当反应变量表现为非连续型变量(如二分类、等级或计数资料)时,GEE方法是常用得最适方法之一。第四部分阐述广义线性混合效应模型(GLMMs)理论及其在二分类、多分类等级变量及其计数重复测量资料分析中的应用。广义线性混合效应模型是线性混合效应模型的自然延伸,该类模型可用于解决连续型和分类变量的纵向研究问题,GLMMs是唯一具有随机效应指数分布族的回归方法,采用一个连接函数将反应变量的均数与个体的线性预测值联系起来;它可以用随机效应拟合各类型相关数据结构模型:当随机效应不存在时,广义线性混合效应模型就退化为广义线性模型。第五部分介绍非线性混合效应模型(NLMEs)理论及其在药物代谢动力学、二分类、等级变量及其计数重复测量资料中的应用。非线性混合效应模型不仅能识别与估计个体间和个体内的变异,而且也考虑了解释变量与反应变量参数的非线性关系,允许固定效应和随机效应进入模型的非线性部分:反应变量可以服从正态分布、二项分布或泊松分布;常用于处理药代动力学、非线性生长曲线研究,也可以直接拟合二分类、等级及计数重复测量资料的非线性模型;近年在工农业、环境和医学界备受关注。第六部分介绍条件脆弱模型理论及其在医学复发事件数据分析中的应用。脆弱模型是Cox比例风险模型的延伸,目的是解释由不能被观测的协变量引起的异质性,脆弱对基线风险函数有乘积效应,即以乘法算子对子组内每一个体的危险率产生影响。脆弱值大的子组比脆弱值值小的子组要在更短的时间内经历事件的发生。一般可认为同一子组内个体有相同的脆弱,因此也称为共享脆弱模型,生存时间被认为是在共享脆弱的条件下独立:脆弱被认为是服从某种分布的随机效应,常认为服从gamma分布。条件脆弱模型将解释观测异质性的随机效应和反映事件相依性的基本事件分层(变化的基线风险)联系起来,把复发事件数据过程的关键特征都包含在模型中,是复发事件数据拟合的理想模型。第七部分通过对非正态、非独立和非线性资料分析方法的介绍,进一步阐述了广义估计方程、广义线性混合效应模型和非线性混合效应模型在医学研究二分类、有序多分类、计数变量以及非线性重复测量资料,脆弱模型对复发事件数据等方面的分析,探讨了SAS软件和R软件分析方法与软件实现,提出了实际应用中有关模型构建、参数估计、软件实现等方面的建议与评价,为非正态、非独立和非线性资料分析应用提供了新思路。文中主要采用SAS9.1.3分析软件GENMOD、GLIMMIX和NLMIXED过程对医学分类及非线性重复测量资料进行了对比分析,采用免费软件R2.4.0实现了临床研究中复发事件数据的分析:运用模型理论与实例分析相结合、方法研究与软件实现相结合的思路,系统介绍了非正态、非线性重复测量资料在模型分析与软件中的应用,结合实例,摸索与总结出具体应用的技能与经验,系统阐述了非正态、非线性资料分析模型及原理,为医学资料的分析提供了方法学基础,也为理论模型与软件应用的结合提供了条件,尤其在淡化抽象的统计理论,以基于理论而又高于理论的思路,突出各种方法的实际应用方面打开了新局面,为正确运用广义估计方程、广义线性混合效应模型、非线性混合效应模型和脆弱模型提供可靠性高、准确性好、信息量大的、解决实际问题可行性强的多元统计方法提出了新观点。
其他文献
<正>1958年是全国"大跃进"的年代,各行各业都在为"大跃进"作贡献,长影也不例外,把艺术创作体制也做了很大的变动,由原来的艺术、摄影、录音、美工等各室合并分别成立了6个创
<正>去年的这个时候,由于一个偶然的机会,我认识了《电影文学》,并发表了自己的第一篇关于影视艺术语言研究的文章。同那些与《电影文学》相伴多年的作者与读者相比,我们之间
<正>井冈山精神和苏区精神,承载着中国共产党人的初心和使命,铸就了中国共产党的伟大革命精神。为贯彻落实习近平总书记"把井冈山精神和苏区精神继承和发扬好"的殷切期望,以
目的:监测重症监护病房(ICU)患者导管相关感染发病情况,为采取相关预防与控制措施提供依据。方法采用目标性监测方法,调查某三级综合医院2012年1月—2013年12月入住综合 ICU 且使
初中是现代学科教育的关键时期,中学生此阶段文化知识学习关系着其未来知识水平的发展。英语是中学教育的主要科目之一,随着新课标对中学英语教学提出了新的指示,教师应积极
目的探讨中西医结合疗法治疗肺癌致癌性胸腔积液的临床疗效。方法选取59例肺癌致癌性胸腔积液患者,随机分为实验组及对照组,2组患者均行西医常规治疗:胸腔抽水,胸腔内注入白
由韦伯作曲、哈特作词的音乐剧《歌剧院幽灵》,1986年首演于伦敦女皇剧院,作为音乐剧成熟时期的经典剧目,为音乐剧的历史的大舞台上添加了最为出色的一笔。迄今为止,该剧是全世界
当前,国内从钢琴教学角度对肖斯塔科维奇《第二钢琴协奏曲》的分析和研究成果甚微,本文通过对其三个乐章的演奏注释,力求使更多的人了解、学习和研究其作品及风格,并为致力于
鉴于目前中国文艺学领域还没有从诗学方面专门系统地阐发业已存在的中国性别诗学的情形,本文以1985-2005这20年来的中国大陆为具体时空标识,考察了全球化视域里的中国性别诗学
<正>数学作为基础的、重要的学科,在我们的日常生活中都有着普遍的应用,尤其是高中数学知识点.所以,学好高中数学,对于学生而言,有着重要的意义.学习数学不仅仅需要新知识的