论文部分内容阅读
MiRNAs是一种内生的,不对蛋白质进行编码的RNA,大约是21-25个核苷酸长。它主要是通过绑定靶基因的3’非翻译区阻碍基因的表达,导致翻译抑制或直接降解从而对生物的生命过程进行调节。了解基因调控网络的内在机制对理解miRNA在许多生物代谢过程中的功能十分重要。所以,针对miRNA与靶基因之间是否存在某种调控关系是生物界研究的重点。为此,本文提出了一种以粗糙集(Rough Set,RS)的依赖度与选取的特征个数的加权和为目标函数,融合粒子群优化(particle swarm optimization,PSO)和遗传算法(genetic algorithm,GA)的调控网络构建方法:PSO-GA-RS。这种方法使用的是miRNA和靶基因mRNA的序列数据,首先根据两者序列数据的结合情况提取包括位置特征,结构特征和自由能特征在内的48维特征;其次综合考虑粒子群算法和遗传算法所拥有的不同优势,将它们进行融合,即引入遗传算法的交叉和变异算子到粒子群优化算法中来寻找比较好的候选特征子集,然后使用粗糙集的依赖度与选取的特征个数的加权和作为适应度函数,找出最优的特征子集;考虑到存在着样本不平衡问题,利用SMOTE算法进行处理;最后再利用SVM对特征选择后的数据进行分类,预测调控关系。通过在拟南芥和水稻数据集上进行实验,该方法可以相对准确的预测出miRNA和靶基因之间的调控关系。MiRNA在应答生物和非生物胁迫中发挥着重要的作用。本文中给出了一种预测miRNA功能的新方法。MiRNA之间的功能相似性矩阵是通过加权的蛋白质网络以及关于图的一些相关性算法进行计算的,随后对得到的相似性矩阵利用一个简单但鲁棒性较好的基于排名的方法构建出一个相似性网络。最后使用一种直推式多标签分类算法(TRAM)对miRNA的功能进行预测。在拟南芥和水稻数据集上的实验结果表明该方法在miRNA的功能预测上是非常有效的。