论文部分内容阅读
近年来,发现一类新的长约21-25nt的非编码内源性小分子RNA--microRNA(简称miRNA)。miRNA的一个特点是它的前体形成茎环结构,成熟体在茎环结构的一侧上,成熟体序列内不能包含大的内环和突环,特别是不能包含大的不对称环。miRNA通过与靶基因mRNA的特定位点互补配对达到对靶基因的降解或翻译抑制,从而参与基因的表达调控。miRNA通常位于基因间隔区(intergenic region),也有一部分来源于编码区的内含子。一些miRNA的基因结构和功能在进化中呈现高度的保守性,但是病毒miRNA和其他一些真核生物的miRNA并不具有这种特点。
由于miRNA对生命体具有非常重要的调控功能,而且近年来发现,miRNA与人类疾病的发生有着密切的联系,因此寻找新的miRNA是生命科学领域的一大热点。04年以来,病毒miRNA又成为研究的重点。寻找miRNA基因的方法有实验方法和生物信息学方法,两种方法结合使用,才能准确地找到miRNA基因。到目前为止,miRBase上公布的miRNA已有5395种,其中病毒的miRNA有130种。然而不同生物中的仍有大量的miRNA基因尚待鉴定,生物信息学分析手段为发现新的miRNA基因提供了有效的方法。从2003年出现第一个miRNA的预测工具MiRscan后,出现了很多计算预测miRNA的方法,根据其本质可以分为五类:同源片段搜索方法、基于比较基因组学的预测方法、基于序列和结构特征打分的预测方法、结合作用靶标的预测方法和机器学习方法。
由于不同病毒的miRNA之间序列相似性极低,不同物种miRNA的特点又不尽相同,针对这一问题,我们开发了一个预测与探寻miRNA基因的计算机软件MiRfilter。MiRfilter是由C#语言编码,文章详细地介绍了它的设计流程,重点讲述了实现预测的三个重要算法:发夹结构判断算法、筛选成熟体算法和CDS字段搜索算法。并详尽地讲解了它的使用方法。我们用两种病毒的miRNA检测软件的精度,结果标明MiRfilter精度较高,假阳性控制较好。