论文部分内容阅读
强直性脊柱炎是一种以炎性腰背痛为特征并不断进展的慢性疾病,常伴有外周关节炎,肌腱端炎和虹膜炎等,严重者可致脊柱畸形和甚至强直。强直性脊柱炎在中国人群的发病率,与欧洲白人的发病率相似,约为0.24%。强直性脊柱炎患者发病5年后,约有4%患者丧失部分劳动能力,而发病45年后约达50%患者丧失劳动能力。AS是一个具有复杂遗传背景的多基因病,因此需要我们从基因,转录以及蛋白翻译等不同水平进行多层次的立体研究,以更加全面地认识该疾病的病因基础,发病风险及进展等机制。本研究分别以转录组(基因表达谱)和发病风险预报两个角度探索AS免疫遗传学发病机制。第一部分基于RNA-Seq技术的强直性脊柱炎免疫遗传机制研究目的:确定中国汉族强直性脊柱炎(ankylosing spondylitis,AS)患者与正常对照外周血细胞转录组表达差异基因,进一步为汉族人AS发病的免疫遗传学机制提供线索。方法:利用7例处于活动期的青年男性AS患者与性别年龄匹配的正常对照的外周血细胞提取的RNA构建测序文库,应用新一代高通量测序平台Abi5500/solid系统进行测序分析,筛选并确定差异表达的候选基因。分别应用实时荧光定量PCR(qRT-PCR)和ABI3730DNA测序仪在55例正常对照和55例AS患者中对候选基因进行差异表达和SNP重测序验证。对表达差异1.5log2(Fold_change)以上的候选基因进行GO分析和KEGG Pathway分析。结果:正常对照与患者间共有7767个基因差异表达(2221个基因表达上调,其中26个基因上调达1.5log2(Fold_change)以上;5546个基因表达下调,其中57个基因下调达1.5log2(Fold_change)以上);在33个迄今为止报道的所有与AS相关的基因中,发现31个基因有表达,其中17个基因表达明显上调;共检测到753个基因上的4137个SNP位点。结合基因差异表达水平和已知的生物学功能,筛选并确定10个差异表达候选基因。在55例正常对照和55例AS患者中对10个候选基因分别进行qRT-PCR基因表达和AB3730DNA测序验证,结果发现SPOCK2基因表达上调(р<0.01);CD69(р<0.01)、ERAP2(р<0.01)、NFKBIA(р<0.01)、TNFR2(р<0.05)表达下调;经对相关基因涉及的SNP进行统计,证明所选取样本含有变异均为普通变异,说明表达差异均有普遍性。对26个表达上调达1.5log2(Fold_change)以上的基因进行GO分析,结果发现在调节细胞凋亡和程序性死亡过程中出现功能富集;KEGGPathway分析发现细胞凋亡通路富集。对57个表达下调达1.5log2(Fold_change)以上的基因进行GO分析,结果发现在细胞表面信号传导、防御反应、免疫应答过程中出现功能富集;KEGG Pathway分析发现Toll样受体信号传导通路富集。结论:除CD69、 ERAP2、NFKBIA、TNFR2等基因介导的免疫性和炎症性模式外,SPOCK2基因介导的软骨代谢与骨形成在AS病理过程中可能具有重要作用。第二部分基于GWAS的AS发病风险预报研究目的:构建基于GWAS中US(美国)和UK(英国)数据的AS发病风险预报模型并在中国汉族人群中进行验证并得出预报率。方法:利用来源于大型GWAS研究中US和UK样本的SNP数据集,通过关联分析筛选出P-value<0.05的SNP,再通过变量选择的方法从筛选出的SNP中得到最优的1~5个SNP组合,然后经Haploview软件连锁不平衡分析检验后,构建成AS发病风险预报模型。通过使用BAYES判别分析和Logistic Regression两种分类方法并结合交叉验证对US和UK人群进行分析,做出AS发病风险预报并得出预报率。经Structure2.0操作软件对不同人群进行遗传学分层检验后,在中国汉族人群中进一步验证并得出AS发病风险预报率。结果:对来源于大型GWAS中US样本(AS患者(case)为900人,正常对照(control)3789人,共4689人)和UK样本(case1153人,control1351人共2504人)的两套数据进行取交集后共得到290372个SNP。通过关联分析筛选出P-value<0.05的SNP;然后再通过变量选择的方法从筛选出的SNP中得到最优的1~5个SNP(rs3915971、rs9266825、rs3128982、rs2844505、rs2248462)组合,经Haploview软件连锁不平衡分析证实5个SNP间无连锁不平衡后,构建AS发病风险预报模型。利用所构建模型对US和UK人群进行AS发病风险预报并得出预报率为,Bayes判别分析(1~5个SNP):调和平均数(HMSS)67.56%~89.14%;Logistic Regression分析(1~5个SNP):HMSS:79.95%~87.95%。利用Structure2.0操作软件对模型中的5个SNP在US、UK和CHB(中国汉族人群数据:case960人,control945人;由上海长征医院提供)三类人群间的分布进行遗传学分层检验,结果证明该5个SNP在各类人群间无明显分层现象。通过使用Bayes判别分析和Logistic Regression两种分类方法并结合交叉验证对来自CHB人群中training和test数据进行分析,分别得出AS发病风险预报率为,Bayes判别分析(1~5个SNP):准确性(Accuracy)69.61%~74.62%,HMSS68.90%~74.60%;Logistic Regression分析(1~5个SNP):Accuracy69.61%~74.84%,HMSS:68.90%~74.83%。结论:利用GWAS中US和UK人群数据筛选出的1~5个SNP组合构建AS发病风险预报模型,在CHB中进行验证并得出较高的预报率。