论文部分内容阅读
在多个组织器官中有一类约有22核苷酸长度的,属于非编码和内源性的小RNA分子片段,即microRNA(简写为miRNA);它们在很多如发育、细胞凋亡的生命进程中起到的重要作用,引起了研究人员的广泛关注并为很多生命科学研究带来了进展。值得一提的是miRNAs建立细胞体系的强大作用,它们靶向一个或者多个信使RNA(即mRNAs),指导RNA诱导沉默复合体,通过降解mRNA或翻译抑制下调基因表达。miRNA是多个发育通路及基因调控机制的关键参与因子,而且是大量遗传疾病及表性决定因素的基础;因此目前已经提出很多针对动物、蠕虫、果蝇及植物等十几个物种中某一个或者多个物种的靶基因预测计算方法。这些算法主要特征包括种子位点的miRNA-mRNA配对特征、位点位置特征、保守性特征、用于评估位点可结合性的最小自由能特征以及表示靶点间最优距离的复合位点等特征。但是能够合并所有现在已知特征并使其作为可调节参数的计算方法还很少。基于计算机预测方法、多种生物实验手段及大量文献的查阅,已经有研究团队对不同物种的经过实验验证或文献发表的miRNA靶基因进行了系统的收集统计和靶基因描述。基于此建立了较完备的数据库,如TarBase,其中包含了注册的miRNA序列数据、预测的靶基因等信息。同时,还有例如NCBI这种权威的RNA基因组数据库的建立,为获取权威数据信息和信息比对提供了支持。近年来,禽流感的爆发、癌症发病率的上升以及张晨宇团队关于植物miRNA进入人体及外源性miRNA介导跨物种传播机制的开创性发现都表明了靶基因预测应用性研究的重要性。尽管宿主miRNA可能会作为抗病毒防御机制下调病毒基因表达,但是还未在人类流感病毒中对此机制进行深入研究;而且由于无法在人体上进行相关实验,因此目前应用生物计算预测与实验相结合是miRNA调控机制研究的主要手段。病理学方面,通过与匹配的miRNA表达谱结合分析胶质瘤基因表达数据,发现了一个后转录调控层,其中包含了超过248000个miRNA介导的相互作用,这在一定程度上说明miRNA在癌症方面具有重要作用。作为临床最常见的恶性肿瘤之一的胃癌,严重威胁着人的身体健康,但是通过生物实验手段进行预测存在着费时耗财等诸多问题,因此计算方法也是用于胃癌研究的重要手段。近来由南京大学张辰宇教授课题组提出的一项重大发现——植物miRNAs可通过日常食物摄取的方式进入人体血液和组织器官,并通过调控人体内靶基因表达的方式影响人体生理功能进而发挥生物学作用,更使得跨物种靶基因预测成为研究热点。但是,目前可用于实验前期指导的跨物种靶基因预测软件却很少。因此本文经过对多个靶基因预测方法的研究,联系时下急切的生物研究需求,改进传统特征,对三维能量特征及基于位置和空位大小的惩罚函数特征算法进行创新,,借鉴数据库这一强大优势,构建了一个跨物种靶基因预测系统平台。它能够平衡敏感度与特异性且时间复杂度低。此外,基于本文构建的平台进行跨物种靶基因预测应用研究。通过预测人编码miRNA与流感病毒基因片段的靶点结合情况分析出人类miRNA对病毒RNA的调控;通过胃癌基因靶点位置预测,指导生物实验并验证了本平台预测的准确性,通过蛋白靶点位置的预测分析出了hsa-miR-625上调的可能性;通过对本文构建平台预测的靶基因进行所属蛋白查找,预测植物miRNA调控人类mRNA的可能性。本平台的构建为生物实验提供了良好的前期指导,节省了大量的时间、人力、物力。现在跨物种靶基因预测仍处于研究的初级阶段,虽然很多预测结果还有待进一步证明,但是未来基于此的药物设计及疾病治疗将会有更大的发展前景。