论文部分内容阅读
miRNA是一种长度约18~25nt的单链小分子非编码RNA,它能够与靶向蛋白质编码基因的转录物mRNA互补配对(或部分互补),进而降解其靶向mRNA或抑制靶mRNA翻译来抑制基因功能。所以miRNA表达水平与其靶向的mRNA成负相关。miRNA在多种癌症中表达异常,导致其靶mRNA表达水平异常,无法正常行使生物功能,是导致癌症原因之一。研究癌症中异常的miRNA,target mRNA表达通路成为研究致癌机制的重要部分。内含子在基因组编码蛋白的DNA中占了非编码序列的绝大部分,广义上来讲,我们也可以把5’和3’非编码区看做是内含子的延伸。起初,这些内含子被认为是基因转录中庞大的遗传无用区,后来由于内含子miRNA(nitronic miRNA)的发现,过往的误解才被纠正。目前已知的内含子miRNA有408条,约占已知miRNA的四分之一。从蛋白质编码基因录产生的前体mRNA(pre-mRNA)的广义内含子区释放出来miRNA,其表达量应和宿主基因表达量正相关。根据以上两种假设关系,即可以构建intronic miRNA-mRNA相互作用网络。本文中,利用GEO数据库公布的17例肾细胞癌和癌旁的miRNA和mRNA芯片表达数据(Series GSE16441),以上述理论为基础,构建了肾细胞癌中异常表达的miRNA-mRNA相互作用网络,用以发现肾细胞癌致癌机理中的miRNA-mRNA的相互作用模式。共获得异常宿主基因共表达内含子miRNA关系18例;异常内含子miRNA抑制靶mRNA关系29例.在过去的十几年中,许多研究利用microarray数据对癌症中异常的miRNA调控靶mRNA生物学过程进行研究,但是没有向更深层的将调控关系延伸到host mRNA中。本文阐述了真核生物中内含子和其他非编码RNA不断进化,通过释放intronic miRNA,为基因表达提供了另一层面上的调控,从而能够形成微调基因表达活性的复杂网络。这个复杂的网络可以由简单的三元组组合而形成“宿主基因—内含子miRNA—靶向mRNA”。由于基因表达量在基因芯片表达谱上都是以mRNA表达量表示的,所以将gene与其转录的mRNA合并为同一元素。将分散的三元组的重叠mRNA和miRNA进行合并,就可以得到更复杂模式,进而可以构建更为复杂的miRNA-mRNA调控网络。总结以上原理,可以建立肾细胞癌中异常表达的两种关系:1异常表达宿主基因与内含子miRNA的正相关关系,2异常表达miRNA对靶向基因的抑制关系。本实验过程可以分为:1、差异性表达分析及聚类分析,2、筛选表达差异的内含子miRNA,并建立intronic miRNA抑制mRNA关系,3、本地数据库构建以及本地Blast比对,4、设计如下打分函数对本地序列比对结果进行筛选,获得mRNA到miRNA正相关调控关系,5、整合以上两种关系构建癌症miRNA调控网络。通过实验,分析肾细胞肾癌中的miRNA调控网络,可以发现很多与一直生物实验分析相吻合之处。同时试验中我们发现,在肾细胞癌中,只发现高表达miRNA抑制靶mRNA表达的现象,而没有发现低表达miRNA降低对靶点mRNA表达水平抑制的现象,这是否是大部分miRNA在癌症中异常表达从而进行异常调控基因表达的一种模式,可以在多种癌症基因表达数据中进行进一步验证(事实上,作者已经对黑色素瘤,非小细胞性肺癌,胰腺癌,肝癌,淋巴癌等癌症基因表达数据进行分析,普遍存在这种趋势);也存在另外一种可能是目前对疾病中低表达miRNA研究过少,从而可以增加此方向的生物学实验。以上理论旁证了本实验分析的准确性,可以根据实验结果中计算的调控关系作为进一步研究肾细胞癌生物实验的理论依据,也可以将此种试验方法推广到多种癌症及其他疾病研究中。验证了实验的合理性后,我们继续将这种方法开发成一款在线的癌症miRNA调控网络构建服务系统。在此系统中,用户可以将miRNA、mRNA的基因芯片数据上传并进行计算分析,系统为用户返回分析结果,为生物学家研究癌症的致病机理等提供信息支持。在本系统中,用户可以将自己的癌症miRNA调控网络结果上传,同其他学术同人进行分享,促进生物学界对癌症的研究进展。为了方便用户的一站式操作,本系统同时提供基因差异表达分析以及基因富集分析功能。并且为了方便组织或个人的批量计算操作,本系统开发了Web Service编程接口,提供java语言版本的客户端。用户可以下载客户端进行使用,也可以使用自己熟悉的编程语言按照系统发布WSDL文件编程,进行自动化的批量的癌症miRNA调控网络系统构建服务。