论文部分内容阅读
由于miRNA对生命体具有非常重要的调控功能,因此寻找新的miRNA是生命科学领域的一大热点。寻找miRNA基因的方法有计算识别方法和实验检测方法,两种方法结合使用,才能准确地找到miRNA基因。根据计算识别方法的本质可以将其归纳为5类:同源片段搜索方法、基于比较基因组学的预测方法、基于序列和结构特征打分的预测方法、结合作用靶标的预测方法和机器学习方法。而目前主要的实验检测方法有以下3类:RNA印迹、实时荧光定量PCR以及芯片技术。
实验室开发了一个自动化预测miRNA基因的计算机系统MiRfilter。本文从参数训练、参数范围训练、候选成熟体打分等方面改进miRNA预测系统MiRfilter,使它适应拥有更长前体的植物miRNA的预测。我们预测了杨树基因组上的miRNA,并对系统进行精度检验。利用MiRfilter系统共预测出3860条候选miRNA;在110个正样本中,正确识别91条前体和80条成熟体,前体预测精度为82.73%,成熟体预测精度为72.73%;在LG IV染色体上得到的1968个负样本中,有12个数据被认为是miRNA,假阳性率为0.61%。本文还详细阐述了MiRfilter系统的总体设计流程,并着重介绍了系统框架中的7个功能模块和3个重要的算法实现。