基于机器学习的microRNA靶标预测算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:livida
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
micorRNA(miRNA)是一类长约22nt的非编码单链小RNA。它通过碱基互补匹配作用于转录后mRNA控制基因表达,发挥其后转录时期的基因调控功能。miRNA作为一种功能性RNA,其功能主要体现miRNA与靶标基因mRNA的相互作用上。miRNA靶标识别成为研究miRNA作用机制的关键。在生物信息学中,miRNA靶标预测研究实质为通过设计生物信息学相关算法,构建miRNA靶标预测模型。基于规则的miRNA靶标预测算法面临预测性能低,假阳性率高等弊端。鉴于生物学家对miRNA作用机制不是非常清晰,机器学习算法通过统计分析智能判定识别规则,成为miRNA靶标预测的重要研究方法。针对miRNA靶标预测高维度、非线性小样本训练集,基于支持向量机算法解决miRNA靶标预测的分类识别问题,对改善miRNA靶标预测性能、正确识别更多未知miRNA阳性靶标意义重大。首先,提出了基于一种新型SVM方法--SVM构建miRNA靶标预测分类器模型算法SVM-MRFS。该算法基于-SVM分类间隔定义了特征有效率,并以特征有效率为标准对原始特征集进行排序,经过不同特征子集中迭代训练寻找最佳特征子集,进而对miRNA靶标进行预测。其次,提出了基于剔除冗余特征构建miRNA靶标预测分类器模型算法SVM-RRFD。算法分析了特征有效率单标准不能剔除冗余特征,又忽略具有较小特征有效率的特征对分类器的作用。因此,算法SVM-RRFD基于-SVM分类器模型,分析原始特征集中两两特征间关联关系,定义了特征冗余度标准。算法通过融合分类识别和特征选择,依据特征有效率和特征冗余度双重标准筛选能够兼顾分类器识别性能和泛化性能的最佳特征组合,基于最佳特征组合训练SVM分类器构建高性能miRNA靶标预测模型。最后,本文在Matlab2009a开发平台下,实现算法SVM-MRFS和算法SVM-RRFD在miRNA靶标预测数据集上的试验仿真。SVM-RRFD算法经过迭代训练筛选出表征miRNA与靶标作用模型的最佳特征子集,用网格搜索寻找分类器最佳参数组合,以期构建高性能miRNA靶标分类器模型。
其他文献
随着教学水平的提升,针对西洋管乐的教学已经逐步开展,演奏基础的训练是学习西洋管乐器思维的重要基础,演奏的姿势、呼吸的规范、发音的标准和气息的调整等这些环节对形成良
旅居荷兰的华侨赵先生在参加今年的春季广交会后,携家人赶到杭州,为的是观看一场期望已久的大型歌舞《宋城千古情》。$$ 近10年来,海内外旅客来杭州,有一个地方不能不去,那就
报纸
1997年3月,《宋城千古情》正式与观众见面,它以杭州地区历史文化、神话传说和民间故事为主线,精选了《白蛇传》、《梁祝》和岳飞抗金等观众耳熟能详的故事元素,高度凝练了杭州当
报纸
随着经济社会的不断发展和科学技术水平的提高,我国的教育体制发生了根本性的变革,翻转课堂教学模式作为一种新型的教学模式,在英语课堂中起到了重要的引导作用,掀起了一轮新
西方先进国家早已放弃的“早期教育”,却被我们的许许多多急功近利的家长匆匆实施。
本文以党中央国务院关于建设美丽乡村的施政方略为指引,提出了努力营造美丽乡村形态美的命题,并结合一些典型例证,对具有普遍共性意义的形态美表现形式及应遵循的基本原则进
<正>葡萄是栽培最早、分布最广的果树之一,在我国主要分布东北、华北、西北、和黄淮海地区,华南也有一定的分布。葡萄是落叶多年生攀缘植物,耐寒能力差,喜干忌湿,根系发达,要
教育教学活动中,秩序的维护、自由的追求、教育利益的获得,都促使了对学生违规行为进行惩戒的需要。教师作为国家与社会的"委托人",作为教育教学活动的主导者,其职业权力中自
以潮土、旱地红壤和红壤性水稻土为研究对象 ,探讨了长期施肥对土壤腐殖质含量与性质的影响。结果表明 ,长期施肥不仅影响土壤腐殖质的含量与组成 ,还影响腐殖质的理化性质。
本文比较了国内外食品接触材料相关标准及法规现状,阐述了食品接触材料相关法规及其添加剂检测标准现状,并对食品接触材料的研究方向及我国食品接触材料标准体系的发展趋势进