论文部分内容阅读
microRNAs(miRNAs)是一类广泛存在于真核生物中的内源小分子RNA,长度仅为19~23nt,不具有编码的功能。它通过形成沉默复合体(RISC)与靶基因mRNAs相结合而行使自己的功能——降解mRNA或抑制mRNA的翻译。目前利用软件对于miRNAs的各种预测中,植物预测准确率比动物预测准确率要高,原因可能是植物miRNAs的保守程度要比动物高得多。
从生物信息学的角度研究miRNA靶基因时,所用到的预测miRNA靶基因的软件有:TargetSan、miTarget、RNA22等,多数是针对某类miRNA而设计的。也有通用软件,如:LIBSVM。研究者们都将重点放在利用各种不同的软件进行靶基因的识别,来评价软件预测的准确程度。这里,将利用LIBSVM来进行动物范围内不同物种间的靶基因预测对比。
首先从数据库中选择5种动物的miRNA靶基因序列,包括:线虫、果蝇、鸡、小鼠、人类,之后对这些序列选用RNAstructure进行RNA二级结构预测。综合序列、结构信息,确定miRNA靶基因的识别参数,再利用LIBSVM构建支持向量机的预测模型。实验结果表明,人类的预测结果相对高一些,最低总准确度(ACC)为57.00%;线虫的预测结果相对低一些,最低总准确度(ACC)是39.00%,二者的各评价参数平均差值最大者可达0.36。所以不同的物种将会对整个动物种群的miRNA靶基因的预测识别产生不同程度的影响。从进化的水平上看,越是低等的动物对动物种群整体的预测影响越大。本预测实验给出,当序列长度选择为100nt、training.data/test.data为2∶1、P/N为1∶2、核函数选择为RBF时,所得结果最为理想,且物种的不同对动物整体的预测识别结果影响最小。这将为今后进一步的动物miRNA靶基因预测研究工作提供有价值的理论参考。