广义线性混合效应模型试验设计若干问题研究

来源 :上海师范大学 | 被引量 : 1次 | 上传用户:AQ0305
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
公共卫生学、医药学、社会学、经济学等领域经常出现离散型的响应数据,比如在临床医学试验中,药物是否有效,是否有毒性,服药后的呕吐次数等响应值为二值或计数型,此类数据之间通常会用广义线性混合效应模型来建模.广义线性混合效应模型是在固定效应模型的基础上引入随机效应,使得模型既能刻画数据的平均变化趋势,又能刻画数据的相关结构.在已有的工作中,大都假设给定混合效应之后,响应之间的相关性完全由混合效应来描述,个体的多个观察响应值之间是相互条件独立的.其实,个体的混合效应一旦确定之后,个体随时间变化的一系列重复响应之间还存在相关性,此类的数据被称为纵向数据,仅仅通过混合效应来描述其相关性是不够的.比如在药物试验中,为研究药物在人体内的代谢过程,需对药物在试验个体血液中的浓度进行多次重复测量,因此同一个体的多个测量值之间应该是相关的.与混合效应模型相比,纵向数据下广义线性混合效应模型的最优设计问题存在一定的复杂性,主要表现在四个方面:一是除了随机效应以外,响应之间随时间变化的相关性如何建模,此时的模型中会出现更多的相关性结构,二是由于广义线性模型是一类非线性模型,设计准则与固定效应参数、随时间变化的相关性结构中的参数以及由随机效应引入的方差结构中的参数有关,三是每个个体的试验次数与设计变量的值可能相同也可能不相同,四是多响应下,每种响应的观测次数与观测时刻点可能相同也可能不同.本文的研究宗旨之一是如何对此类纵向离散响应数据进行建模,以及如何科学有效地安排试验,使得能用少量的试验次数获得对所建模型具有最有效的统计信息.通过借鉴并发展线性混合效应模型下的建模与分析方法,研究单(多)响应具有混合效应的广义线性模型的最优设计和稳健设计.另外,由于广义线性混合效应模型的最优设计依赖于模型参数,相关的稳健设计有待进一步的研究,本文基于数论方法,讨论一种对最大最小设计准则和超立方体设计准则的改进方法,并以Poisson混合效应模型为例说明该方法的有效性.本文研究工作主要包括下面五个部分:Ⅰ.纵向数据Poisson混合效应模型的最优设计本章把Niaparast(2010)的结果(ρ=0,响应之间条件独立)推广至纵向数据的情形(0≤ρ≤1).AR(1)结构建立纵向数据之间随时间变化的时间序列模型,利用拟似然方法给出模型的近似信息矩阵.为克服局部D-最优设计对模型参数的依赖性,在给定参数的先验分布时,给出了模型的伪贝叶斯最优设计;由于先验分布对最优设计仍存在一定的影响,进一步地,考虑模型的多层伪贝叶斯最优设计.结果显示,在试验经费受限的前提下,纵向数据自相关系数、费用比值均对最优设计有一定的影响.利用D-相对效率,将等距设计与多层伪贝叶斯最优设计也进行了比较.Ⅱ.纵向数据多响应线性混合效应模型的D-最优设计本章考虑纵向数据多响应线性混合效应模型(模型阶数≤4)的D-最优设计问题,利用AR(1)自相关过程描述某个指标重复观测响应之间的相关性.发现一旦给定线性回归的阶数,多个响应之间的相关系数对最优设计点位置的影响很小,特别是重复观测响应向量的自相关系数比较大的时候.在试验经费受限制的条件下,对D-最优设计与等距设计的效率进行了比较,发现自相关系数越大,设计点个数越多,两者的差别越小.还讨论了线性回归模型阶数未知时的稳健设计,发现自相关系数很小时,选择回归阶数尽可能高的线性模型,其对应的D-最优设计效率最高,其次是等距设计;而当自相关系数很大时(接近1),等距设计和对阶数的任意假设所得的D-最优设计效率相差无几(除了模型阶数为3的情形).Ⅲ.纵向数据多响应Logistic混合效应模型的最优设计本章考虑纵向数据多响应Logistic混合效应模型的最优设计问题.借助二值响应的模型分解和罚拟似然估计方法得到模型的近似信息矩阵.在试验费用有限制的条件下,得到了D-最优设计,并且发现纵向数据之间的自相关系数对设计还是有比较大的影响.由于近似信息矩阵中是含未知固定效应参数的,所得的D-最优设计其实是局部最优设计,为解决这个问题,考虑伪贝叶斯最优设计准则,结果显示伪贝叶斯最优设计准则对纵向数据之间的自相关系数(取值超过0.01)保持了稳健性,新增个体费用与新增一次重复观测费用的比值对最优设计有显著的影响.Ⅳ.不平衡设计下纵向数据多响应混合效应模型的最优设计本章考虑不平衡设计下纵向数据多响应混合效应模型的最优设计问题,多响应为离散-连续混合的情形,且各个响应指标的试验观测次数、观测点可能不完全一致.本章依然采用二值响应的模型分解和罚拟似然估计方法得到模型的近似信息矩阵,利用模拟退火算法得到模型的不平衡D-最优设计,并给出了两个模拟算例.最后,将平衡设计下的线性试验经费函数推广至不平衡设计的情形,据此定义给出不平衡设计下的相对D-效率的定义.Ⅴ.Poisson混合效应模型的一种改进的稳健设计方法考虑最大最小最优设计准则(MMD)和超立方体最优设计准则(HClnD)的一种改进方法.以给定混合效应后,独立重复响应的Poisson混合效应模型为例,讨论其线性预测部分为一次线性回归函数和二次回归函数情形时的稳健设计.在假设固定效应参数的先验分布为正态分布时,以分布中抽取的”代表点”作为参数的取值集合,在此集合上定义模型的一种新的最大最小设计和超立方体设计.利用模拟退火算法计算相关的结果,将本文定义的新的设计准则与Lee(2010)中提出的设计准则,以及伪贝叶斯设计准则作比较,并从设计的相对D-效率,固定效应参数估计的精确度,程序的运行速度三个方面说明了”代表点”方法的优越性.
其他文献
世界人口的持续增长与世界各国的经济发展,导致全球水资源短缺和此起彼伏的国际跨境水资源利用冲突,给世界各国开发利用跨境水资源带来巨大的政治和经济压力。澜沧江—湄公河
基于机器人在平面区域运动的避障问题,通过单一障碍物路径长度设计算法,利用MATLAB软件进行分别计算,综合比较得出机器人从区域起点到达目标点的避障最短路径。
采用高效液相色谱(HPLC)分析普洱茶、乌龙茶、绿茶和红茶连续三次水浸泡物中茶多酚类及嘌呤类生物碱的含量。利用PC12神经细胞损伤模型比较四种茶叶提取物对于PC12神经细胞的
目的探讨降钙素受体(CTR)基因多态性与新疆维吾尔族小儿上尿路含钙结石形成的关系。方法选择新疆维吾尔族上尿路含钙结石患儿为试验组(n=89)、维吾尔族正常儿童为对照组(n=12
目的 :考察双藤慢肝胶囊治疗慢性肝炎及其对血清生理氨基酸比值的影响。方法 :选取符合诊断标准的慢性肝炎病例191例 ,随机分为治疗组100例、对照组91例 ,两组均予一般护肝降
目的:探讨糖皮质激素性骨质疏松症的发病机制和预防。方法:①细胞学实验:从新生SD大鼠颅盖骨分离培养成骨细胞,随机分为3组,A组给予1×10-7mol/L地塞米松1、×10-7mol/L辛伐
目的比较肝癌(Hepatocellular Carcinoma,HCC)合并肝硬化和肝癌不合并肝硬化的乙肝表面抗原(Hepatitis B Surface Antigen,HBs Ag)阳性患者,两者在术中情况和围手术期并发症
利用江苏省常州地区龙虎塘观测站、金坛、溧阳观测站50年气候资料,在VisualFoxpro6.0数据库中对常州地区云能天、风速和日照资料进行统计,得出本地区风能、太阳能资源的时空
为研究凉茶抗氧化作用,采用Na NO2-Al(NO3)3-Na OH比色法测定了4种市售凉茶的总黄酮含量,并以1,1-二苯基-2-三硝基苯肼(DPPH)、铁离子还原能力2种体外抗氧化活性方法测定了市