论文部分内容阅读
目的:精神分裂症是一种常见且危害极大的精神疾病,其发病机理迄今未明,早发精神分裂症是其中一种重要的临床亚型,预后更差,不良结局发生率较高。长非编码RNA(Long non-coding RNAs,Lnc RNAs)是一类长度超过200个核苷酸,无或少有蛋白质编码功能的非编码RNA分子,可从多种途径参与基因表达调控过程,但其具体功能及对疾病的影响仍不明确,从lnc RNA角度探讨其对早发精神分裂症的调控作用有助于阐明疾病的发病机理。随着芯片技术的发展使得高通量检测lnc RNA成为可能,同时对数据分析策略与方法提出了新的挑战。基于单个基因层面差异表达的传统分析方法已经不能满足临床研究的需要,本文拟从系统生物学角度出发,综合多种遗传统计和生物信息学方法,探讨lnc RNA表达变化在早发精神分裂症患者发病中的作用,并结合m RNA在早发精神分裂症患者中的表达及其功能注释,对早发精神分裂症疾病相关lnc RNA可能功能进行初步探索。方法:方法:本文收集19例早发精神分裂症患者及18例年龄、性别匹配的正常对照,抽取外周血为生物标本,应用lnc RNA芯片检测两组研究对象外周血lnc RNA及m RNA表达水平,综合差异表达分析(Differential Expression Analysis,DEA)、加权基因共表达网络分析(Weighted Gene Co-Expression Network Analysis,WGCNA)、典型相关分析(Canonical Correlation Analysis,CCA)、功能富集分析等方法进行早发精神分裂症相关lnc RNA及功能分析。结果:结果:1、差异表达分析结果表明,与正常对照组相比,早发精神分裂症患者共有3416个lnc RNAs表达改变,其中上调lnc RNAs1153个,下调lnc RNAs2263个;共有3684个m RNAs表达改变,其中上调m RNAs2778个,下调m RNAs 906个。首次发现了早发精神分裂症患者lnc RNAs表达水平有改变。2、利用差异表达分析获得的差异lnc RNAs表达谱及差异m RNAs表达谱,应用加权基因共表达网络分析(WGCNA),分别构建lnc RNAs及m RNAs共表达网络。网络构建分两步,首先单独构建患者组与对照组共表达网络,两组之间模块(Module)保守,提示早发精神分裂症患者在lnc RNAs及m RNAs层面未发现存在整体扰动和变异。后合并两组数据集,构建9个lnc RNAs共表达网络模块,进一步计算模块特征根(Module Eigengene,ME)并与疾病特征进行相关与回归分析,获得2个早发精神分裂症风险lnc RNAs模块(lnc RNAs Module Blue,lnc RNAs Module Brown)并筛选出Blue模块内6个起主要调控作用的hub lnc RNAs,以及Brown模块中20个hub lnc RNAs。同理,又构建了13个m RNAs共表达模块,获得3个早发精神分裂症风险m RNAs模块(m RNAs Module Turquoise,m RNAs Module Brown,m RNAs Module Greenyellow),每个模块中各筛选出2个hub m RNAs。对m RNA模块和hub m RNAs进行功能注释和富集分析表明,早发精神分裂症发病相关的m RNAs主要富集于线粒体及其相关生物学过程。3、利用早发精神分裂症风险模块中的hub lnc RNAs及hub m RNAs,应用典型相关分析(CCA),探讨所测hub lnc RNAs与hub m RNAs之间的相关关系。结果表明,第1、2、3对典型变量的累计贡献率达98.39%,并发现特定hub lnc RNAs与m RNA高度相关性,提出二者在功能上的相似性,上述早发精神分裂症相关lnc RNAs可能与线粒体及相关生物学过程有关。结论:结论:2个lnc RNAs共表达模块与早发精神分裂症相关;3个m RNAs共表达模块与早发精神分裂症相关,其功能显著富集于线粒体及其生物学过程;早发精神分裂症相关hub lnc RNAs及hub m RNAs之间存在显著相关;早发精神分裂症相关lnc RNAs功能可能与线粒体及其生物学过程有关。本文为“lnc RNAs介导m RNAs引起线粒体功能损伤参与精神分裂症病理机制”提供依据。本文提示整合的研究策略(差异表达分析-加权基因共表达网络分析-典型相关分析)可有效揭示早发精神分裂症转录组改变。