论文部分内容阅读
背景人类身高是由多基因控制的复杂数量性状,主要受遗传因素影响。随着全基因组关联分析的应用,人类身高的遗传学研究取得了突破性成就。截止到2019年,共发现约780个身高关联性变异位点,身高预测目前主要运用加权等位基因求和法(weighted allele sums,WAS)对人群身高进行预测,基于单核苷酸多态性(single nucleotide polymorphism,SNPs)遗传标记推测成年人的身高,对法庭科学学领域个体识别等具有重要的实践意义。目的为了筛选出更多与四川和内蒙汉族人群身高关联性变异位点,选取已知身高关联的31个SNP位点,在1221例四川和内蒙汉族人群中验证其身高遗传关联性,构建身高预测模型并评估该模型的身高推断能力。方法1.知情同意下,采集四川汉族964例、内蒙汉族257例外周静脉血,提取基因组DNA用于SNP检测。2.根据前期文献调研,筛选出身高关联SNP位点31个;采用SNaPshot技术分21个位点和10个位点两个荧光复合检测体系,利用GeneMapper软件获取基因型数据。3.根据地域和性别等因素将样本分为6组,数据采用3种方案进行关联性分析。前2种方案分别基于两种多元线性回归分析;第3种方案基于logistic回归分析,分别对每一组样本进行二分类变量关联性分析。最后,对6组样本的关联性分析结果进行综合分析,筛选出与身高关联的SNP遗传标记。4.筛选出22个位点建立身高预测模型,样本分为4组,每一组又分为高身高组和矮身高组。先采用WAS分别建立高身高组和矮身高组的身高推测模型,进一步通过受试者工作特征曲线(receiver operating characteristic,ROC)及曲线下面积(AUC)分别进行身高预测准确性评估。最后对4组模型的身高预测准确性进行合并和综合评估。结果1.建立了基于SNaPshot技术的31个SNP位点用于推断身高的方法,根据是否有无多态性和beta值,确定22个SNP遗传标记可用于建立WAS法等身高推测模型。2 3种身高关联性分析方案分别发现3个、4个、6个身高关联性SNP位点(P<0.05)。其中rs3823418、rs2166898在3种方案中与身高均呈关联性(P<0.05)。3.22个SNP位点在不同群体中的身高准确性预测:预测准确性最高的为四川男性样本,AUC 值为 0.67(95%CI 0.55-0.79)。4.绘制WAS值密度曲线图显示高身高与低身高密度曲线重合面积较大,表明低身高到高身高的变化趋势不明显。结论1.建立了基于SNaPshot技术检测31个SNP位点用于推测身高的方法。2.筛选出了 rs3823418等7个身高关联性SNP遗传标记,并且在四川和内蒙汉族人群中与身高具有显著关联性。3.身高预测模型的预测准确性四川汉族群体高达0.67,从而为法庭科学对个体身高的预测提供了基础数据和技术支持。