论文部分内容阅读
在后基因组时代,单核苷酸多态性(single-nucleotidepolymorphisms,SNPs)研究已成为生物医学研究的热点这是因为SNPs是最常见的人类序列变异,广泛分布在人类DNA中,且SNPs的检测已自动化目前,与SNPs相适应的统计学方法,已成为统计遗传学领域研究的热点有学者将潜在结构模型(latent structural model)或潜变量模型(latentvariable model)引入单体型或高维SNPs整体效应的关联分析及其相关的推断性研究但潜变量模型要求观测变量与潜变量服从正态分布,SNPs数据无论以何种遗传模式量化,都违背其正态假定为此,本文针对SNPs数据不服从正态分布的情况,拟采用S-B估计方法拟合验证性因子模型,进行SNPs整体效应和关联性分析本文详细介绍了验证性因子模型的有关理论,包括模型概述模型参数估计模型拟合评价及模型修正的相关内容其中着重介绍模型参数估计的几种方法:最大似然估计Browne’s渐近任意分布方法S-B测度调整(scaled)估计并对几种方法方法做比较,得出S-B估计方法为最适合处理SNPs数据的参数估计方法在此理论的基础上,用GAW17提供的SNPs数据进行实例分析本次研究随机选取2号染色体上,分布在6个基因之中的13个SNPs作为研究对象,结果显示:ML估计方法卡方自由度比2/ df=3.59,S-B调整估计方法卡方自由度=2.89,ML估计法RMSEA=0.061,S-B调整估计法RMSEA=0.052此结果表示使用S-B调整方法得到的拟合指标较ML法好,说明在处理SNPs数据时,使用S-B估计能得到更好的拟合模型此外,由于6个基因之间的相关系数很大,所以将这6个基因作为初阶因子,做二阶验证性因子分析,能得到一个拟合很好简洁的二阶模型该实例通过GAW17提供的模拟数据,对选取的6个基因做潜变量得分,然后对基因和疾病感染做t检验,得出6个基因对该感染都有影响,可以推测这6个基因下的13个SNP位点可能是感染的致病位点对二阶因子和疾病感染做检验,得到基因A对感染有影响( t 3 .657, P 0.001)本文的讨论部分简要介绍了本次研究的主要内容,并对ML参数估计与S-B调整估计方法高阶验证性因子模型与验证性因子模型分别做了比较,此外,在讨论部分,本次研究的优缺点及研究展望也作了阐述