论文部分内容阅读
本文完成了一种脊椎动物miRNA成熟体预测方法,它依据miRNA在生物体内的具体成熟机制,利用能量和结构的特征,具有较高的准确度,可以为实验寻找microRNA提供理论指导。 miRNA作为近年来的研究热点,是一类小分子的非编码RNA,它通过与mRNA的3-UTR的特异性结合而抑制其表达,从而起到调控基因表达的作用。该类小分子RNA几乎参与到生物体的所有细胞过程中,并在多种物种中展现其调控功能。检测microRNA的实验方法不可避免地受到microRNA表达的瞬时性、组织特异性及miRNA表达量的限制;近几年发展起来的“高通量测序”技术又伴随着数据的“庞大性”,因此也需要计算机预测方法对测序结果进行辅助分析。 microRNA的成熟依次经历了Drosha酶和Dicer酶的剪切,并且在剪切过程中都形成了“茎环结构”,这种“茎环结构”可以说是判别miRNA及利用计算机方法预测miRNA成熟体的一个重要依据。但由于生物体基因组中有大量的序列可以形成“茎环结构”,因此miRNA序列必然存在着某种或者某些特征,使得这类分子可以被Drosha酶和Dicer酶识别,从而产生成熟体miRNA。当前已经有多种计算机方法通过识别miRNA成熟体序列的特征来预测miRNA前体,还没有专门设计来用于从pri-miRNA序列上发现成熟体miRNA序列的工具。 针对上述问题,我们经过统计,在pri-miRNA及pre-miRNA序列及结构上发现了一些具有生物学意义的特征,并利用这些特征开发了用于预测脊椎动物成熟体miRNA的方法MiRmat。该工具可以从pri-miRNA序列上直接预测出可能的成熟体,实验检测其预测结果具有较高的精度:对于Drosha位点预测可以达到84.0%(2nt误差)的准确度,对于Dicer位点预测可以达到92.8%(2nt误差)的准确度,并且由于MiRmat的开发没有基于物种间的保守性,因此可以被运用来预测几乎所有的脊椎动物miRNA成熟体。