论文部分内容阅读
背景和目的:
随着Microarray技术(芯片技术)的不断发展,新的分析方法和新的计算工具不断涌现,如何从海量芯片数据里更有效地提取关键信息,如何设计高效的计算方法,已成为当今生物信息学研究中的一大热点。数据挖掘以及生物信息学技术的发展与应用在关于疾病发病机制及揭示信号通路中关键基因/蛋白的研究中发挥着日益重要的作用。
心肌肥厚是心血管疾病的重要病理改变,它是对于心脏超负荷工作的适应性反应。多种因子共同参与了心肌肥厚这一病理过程。近些年来,MicroRNA在心肌肥厚与心衰过程中扮演的角色逐渐成为一个研究热点。虽然MicroRNA的芯片数据分析方法已有很多,但是还有进一步发展的空间。
本研究对高通量MicroRNA芯片所采集的大量数据进行分析挖掘,将2种常用的数据标准化处理方法(基于总光密度的方法和Lowess回归分析)和3种常用的差异MicroRNA分析方法(SAM分析、EDGE分析和Fold Change分析)综合判断、分析在心肌肥厚与心衰过程中的相关MicroRNA。同时,将属于同一个MicroRNA Family以及同一个Cluster的MicroRNA数据加以整理,提出MicroRNA Set的概念,利用GSEA(基因集合富集度分析)方法对MicroRNA Set进行分析,找出心肌肥厚与心衰的相关MicroRNA。进一步地,利用TargetScan、Pictar、miRanda这3种MicroRNA靶基因预测方法,预测心肌肥厚与心衰相关MicroRNA的靶基因。
这种新的思路与数据整合处理方法可以弥补单一数据处理方法的不足,它对于生物信息学方法学的改进以及疾病模型相关MicroRNA的研究有着积极的意义,并且对后期的生物学实验具有指导意义。由于本研究是基于现有的处理方法之上,而且数据主要是通过文献和数据库挖掘所得;同时,在实验参数的设置上还在摸索;因而所预测的结果还并不是很完善,也会遗漏掉一些心肌肥厚/心衰相关的重要MicroRNA。
方法:
1、本研究以小鼠心脏细胞为实验模型,制备小鼠心肌肥厚不同病理时程模型(心肌肥厚和肥厚失代偿期)。
2、在MicroRNA芯片数据处理时,将数据标准化处理方法和差异MicroRNA分析方法加以组合。同时提出基于MicroRNA Family和MicroRNA Cluster的MicroRNA Set的概念,利用GSEA方法对MicroRNA Set进行分析,找出心肌肥厚不同时程模型(心肌肥厚和肥厚失代偿期)的相关MicroRNA。并将以上两种手段获取的相关MicroRNA与现有的MicroRNA与疾病数据库(HMDD、ARGONAUTE2、mir2disease)进行比较。
3、在得出相关MicroRNA的基础之上,继续利用数据整合方法,利用TargetScan、Pictar、miRanda这3种MicroRNA靶基因预测方法对相关MicroRNA的靶基因进行预测。并将结果与现有的心肌肥厚/心衰相关基因数据库(BJMUCardio)进行比较。
4、比较心肌肥厚和心衰过程中共同的和不同的MicroRNA及其作用靶基因。
结果:
1、芯片数据处理过程中不同的组合方法在预测相关MicroRNA的数量和准确性(百分比)方面具有很大的差异。在心肌肥厚模型中,采用“Lowess数据标准化处理方法+ EDGE差异MicroRNA分析方法”的结果加以综合判断,不仅可以控制预测差异MicroRNA的数量(28个,39.3%,p<0.05),而且预测的准确性也比单一的直接采用“总光密度法+Fold Change”要好(149个,17.4%,Fold Change变化>1.5)。在心衰模型中,也有类似表现(具体结果可参加正文结果部分)。
2、提出一种MicroRNA Set的概念,计算得到的与心肌肥厚相关的差异MicroRNA为24个,其中8个(33.3%)曾被报道与心肌肥厚相关;与心衰相关的差异MicroRNA为26个,其中7个(26.9%)曾被报道与心衰相关。与关注于单个MicroRNA的方法相比,预测得到的相关MicroRNA处于同一个Fanuly Set或Cluster Set,具有类似的性质。这种MicroRNA Set的方法可以同时研究很多在同一通路中的相关MicroRNA。
3、将心肌肥厚/心衰相关的MicroRNA通过不同的靶基因预测方法进行计算,分别选出最有可能的30个MicroRNA作用靶基因,同时将这些靶基因与现有的心肌肥厚/心衰相关基因数据库(BJMU Cardio)比较,发现DMD、CAMK2G、ACTA1、ATP2A2这4个基因曾被报道和心肌肥厚有重要相关性;DMD、DCX、CACNB2、SEMA6D、ACTA1、ABCB9、CALD1这7个基因曾被报道和心衰有重要相关性。同时预测得到多个靶基因(多为细胞代谢、信号转导相关)可能在心肌肥厚/心衰两种过程中都有相关性,如ABCB9、ACTA1、CACNB2、DMD、SNX16等。
结论:
1、在MicroRNA芯片数据处理方法中,首次应用组合方法预测心肌肥厚/心衰相关MicroRNA,发现不同的组合之间的结果具有较大差异性。组合的方法可以提高预测效果,弥补单一处理方法的不足,是方法学上的改进。
2、首次将MicroRNA Set的概念用于分析心肌肥厚/心衰过程的相关MicroRNA。可以同时研究多个处于同一Family或Cluster的相关MicroRNA。
3、根据本研究的预测,与心肌肥厚最相关的MicroRNA可能还有hsa-mir-138、hsa-mir-18a、hsa-mir-425、hsa-mir-30d等;与心衰最相关的MicroRNA可能还有hsa-mir-143、hsa-mir-668、hsa-mir-9、hsa-mir-199a-3p等;hsa-mir-99b可能与心肌肥厚和心衰都有重要相关性。
4、根据本研究的预测,提示MicroRNA可能通过系列最相关的基因在心肌肥厚和心衰过程中发挥重要作用。在心肌肥厚中,这些基因是DMD、CAMK2G、ACTA1、ATP2A2等;在心衰中,这些基因是DMD、DCX、CACNB2、SEMA6D、ACTA1、ABCB9、CALD1等。另外,提示DMD、ACTA1等基因则在心肌肥厚/心衰过程中同时发挥了重要作用。