纵向等级数据基于秩次的非参数方法研究

被引量 : 3次 | 上传用户:yzq660511
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景与目的:纵向等级数据又称为纵向有序分类数据,类属于纵向数据(longitudinal data),是每个受试个体或单位在不同时间以有序分类重复度量所获得的数据,换言之,是由横断面数据和时间序列融合在一起的重复测量(repeated measures)数据。此类数据不仅可以反映不同时间点的处理间差异(横断面效应),还可以反映这种差异随时间的变化趋势(纵向效应)。纵向等级数据在医学研究领域甚为常见,如整体疗效评价(痊愈、显效、有效、无效)的随访数据等。关于定量纵向数据的分析手段较多,且较为成熟,不过这些方法对数据的分布具有较严格的限制。对于纵向等级数据,目前尚缺乏有效的分析方法,为此,本研究拟以秩次思想为基础,以涉及处理、时间这两个影响因素的纵向数据为研究对象,通过数据在相应效应检验的原假设下呈现出的图形规律,构造秩次统计量,建立基于秩次的纵向等级数据非参数方法,使之可应用于重复测量的复杂实验设计中;不仅能分析处理、时间等主效应,也可分析因素间的交互效应。同时非参数方法无分布条件约束,从而适用范围更广,以期为纵向等级数据分析方法提供新思路,为改善现有方法的局限性提供新的途径和策略。纵向等级数据基于秩次的非参数方法的建立:本研究分为两部分。第一部分为有关非参数方法统计量的理论推导阶段,将H0下数据在形态上的轮廓特点转换为数学公式表达,分别构造交互效应统计量、在交互效应无意义时的主效应统计量及在交互效应有意义时的主效应统计量,导出各统计量的统计分布,计算对应的自由度,并推导分类数据同秩较多时的统计量“校正系数”。第二部分为非参数数方法应用的验证与比较阶段,随机生成模拟数据,设定参数,分别估计不同参数下各效应的Ⅰ类错误率α值和检验效能1-β值;引入常用的秩转换的重复测量方差分析统计方法,与非参数数方法比较,并讨论样本量对两方法的影响,进一步说明各方法优劣性。第一部分,统计量构造的理论推导。交互效应统计量。H0为无效假设,因此在H0下假定纵向数据中无交互效应存在,而表现在轮廓上即处理组间不同时间的效应趋势图重合或平行。由于分类数据间只代表等级的差别,不具有差异大小的定量区分,因此先对数据编秩,然后将平行特点用数学公式表达出来。其中编秩方法与统计量构造思路有关。所以交互效应的统计量就是描述趋势线图的平行的关系,从而有R1.2-R2.2=R1.3-R2.3…=R1·T-R2·T=0,令Rglt,Rg2t,…,RgNt为在样本量为N的△glt,△g2t,…,△gNt样本中的秩,△git=Ygit-Ygi,t-1,其中g表示组别,i表示个体,t表示时间。如果这种平行关系发生的可能性为小概率,则拒绝H0。根据此想法,依据中心极限定理,计算期望及方差,对上述数学公式做标准化变换后平方,则其服从x2分布,有秩和检验在处理纵向等级数据时通常需要做出校正,主要目的是修正相同秩较多时随机变量的方差会随之减小对统计量造成的影响;换句话说,当观测结果出现相同秩次较多的情况下,检验统计量中的总体均值不会变化,但方差变小,进而统计量也随之变化,医学统计中把这一变化称之为“校正”。所以在上述统计量基础上进一步对其分母做出“校正”,其“校正系数”经推导得到其中ωtk表示在时间t的N个秩次中第k个相同秩次的个数,于是交互效应检验统计量为同理得到处理效应及时间效应的检验统计量。由于主效应在交互效应是否有统计学意义下表现的图形特征有所不同,所以分别给出交互效应检验不同结果基础上的两个主效应检验统计量。同样也对同秩较多做出“校正”。处理效应检验统计量。当交互效应无统计学意义时,有同秩较多时,“校正系数”经推导得到于是有当交互效应有统计学意义时,同秩较多时,“校正系数”经推导得到于是有时间效应检验统计量。当交互效应无统计学意义时,有同秩较多时,“校正系数”经推导得到于是有当交互效应有统计学意义时,同秩较多时,“校正系数”经推导得到于是有第二部分,方法的模拟验证评价。本研究主要是将所提出的的基于秩次的非参数方法与现在比较常用于处理分类纵向数据的秩转换的重复测量方差分析做方法比较。一方面通过对正态分布和均匀分布数据,选取不同的标准差和相关系数,考察分布类型、个体变异大小及重复观测的相关性强弱对两种方法的影响;一方面对均匀分布数据,通过变换样本量,考察样本量不同情况下两方法的稳定性。通过上述两个方面评价所提出方法的统计性能,并对两种方法进行比较。结果:Ⅰ类错误率α:1)针对交互效应检验,当样本量n<30时,非参数方法α值均较小,随着样本量增大,这种偏倚性随之消失;而标准差和相关系数的大小对交互效应影响的差异则较小,几乎可以忽略。2)针对处理效应检验,当交互效应无意义时,标准差越小,非参数方法越稳定,而随着标准差变大,结果随之出现较大波动;方差分析的结果刚好相反。当交互效应有意义时,非参数方法在n<30情况下,其α值均较小。而当样本量增大时,这种偏倚性随之消失。而随着标准差增大,方差分析方法的α值波动也变大,提示个体变异较大时,使用秩转换的方差分析,结果较不稳定。3)针对时间效应检验,交互效应无意义时,当相关系数较小,样本量也较小时,非参数方法的α值也较小,相对显著性水准0.05会出现偏倚,当样本量增大,偏倚性随之消失;而相关系数增大,即使样本量较大时,方差分析法也会产生偏倚,提示秩转换的方差分析在处理个体间变异小而重复测量数据相关性较强时,需谨慎使用。交互效应有意义时,当相关系数较小,非参数方法的α值偶尔也偏小,随着样本量的增大,该情况会减弱;当相关系数变大时,偏倚仅出现在n<30的情况,随着样本量的增大,对α的偏倚性随之消失。检验效能1-β:1)针对交互效应检验,当样本量较小时,两方法的检验效能相差不多,非参数方法稍优于方差分析;随着样本量增大,尤其是当n>60时,非参数方法较方差分析的优势更为明显,且非参数方法的检验效能随样本量的增大而增大,当样本量达到100时基本趋于稳定,检验效能趋于90%。而相关系数对该方法的影响可以近似忽略。2)针对处理效应,无论交互效应是否有意义,在各样本量下非参数方法均优于方差分析,且方差越大,两方法的检验效能差异也越大。3)针对时间效应,交互效应无意义时,样本量较小,方差分析方法的检验效能优于非参数方法;随着样本量增大,尤其当n>60时,两方法的检验效能基本相同。交互效应有意义时,不同样本量下,方差分析法的检验效能始终优于非参数方法,但二者之间的差距随着样本量的增大而不断减小,且两种方法的检验效能在n>60的情况下均渐趋稳定。结论:1)基于秩次的非参数方法可以分析纵向数据,其不受数据分布类型限制,尤其适用于非正态分布资料,如纵向等级数据。2)基于秩次的非参数方法针对交互效应建立了单独的检验统计量,可以有效地分析交互效应,并且得到针对交互效应的统计推断,改善了以往方法将各效应混合在一起分析,而无法给出各效应各自结果的情况。3)基于秩次的非参数方法建立在中心极限定理基础上,因此在应用中应满足n>30,当n>60时,结果更为稳健。4)基于秩次的非参数方法中对处理效应的检验效能不理想,可以在之后的研究中进一步改进和完善。5)现在较为常用的处理分类纵向数据的秩转换的重复测量方差分析,若处理各等级近似均匀分布的数据,由于方法受个体变异大小及重复观测间相关性强弱的影响,因此使用时应谨慎。
其他文献
目的调查甲状腺瘤患者日间手术治疗满意度情况,发现问题,提出改进措施。方法 2014年5月—2016年11月,对108例甲状腺瘤患者日间手术治疗出院1个月后进行满意度调查。使用西南
<正>【案情介绍】2008年2月,北京某药监分局接到电话举报,反映本市某小区10号楼1单元203室出租房内有人生产假药;经药监分局和公安分局执法人员现场检查,发现"基因癣康"、"癣
随着体细胞核移植相继在多种动物中取得成功,异种细胞核移植技术在拯救濒危野生动物、人类干细胞克隆和细胞核质互作研究等方面具有特殊意义,受到广泛重视并取得了很大进展.
支链氨基酸与芳香族氨基酸摩尔数之比称为F值(Fischer ratio).本文叙述了已报道的高F值制品经注射或口服均可改善肝性脑病病人血液氨基酸的功效,并对其药理及临床实效进行了简介. 本研究以玉米黄
以几种代表性的甲醛捕捉剂(乙烯脲、硫脲、己二酸二酰肼、乙醇胺、亚硫酸氢钠、凹凸棒土)为研究对象,以胶合板的甲醛释放量和胶合强度为指标,比较了上述甲醛捕捉剂对胶合板性
目的:研究配戴框架镜与配戴角膜接触镜的近视患者接受准分子激光手术后生活质量的变化。方法:选取72例接受准分子激光近视手术的患者按术前矫正方式不同分为两组,配戴框架镜
陵川方言语气词"嘞"的语用功能主要表现为:其一,完句功能,有些句子句末只有加上语气词"嘞",语义上才能自足;其二,标记功能,包括停顿标记和信息标记;其三,凸显情感,陵川方言语
目的根据2015—2017年云南省大理白族自治州(大理州)死因登记报告数据,分析当地居民伤害死亡水平和伤害原因。方法收集2015—2017年大理州居民伤害监测资料,对伤害致死的病例
社会经济的不断发展在提高了人们的生活质量的同时,也造成了一定程度的环境污染,这就促使绿色化学化工被提出的一个主要因素。文章主要从国内化学化工发展的现状以及其发展策
生产销售假药是药品违法行为中危害性最大的一种,该罪不仅是《药品管理法》重点打击的违法行为,而且也是当前整顿和规范市场经济秩序中的重点商品之一,因此结合《刑法》学习