基于SVM算法的微小RNA靶标预测研究

被引量 : 0次 | 上传用户:felltwo23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微小RNA(microRNA,miRNA)是一类约22nt的重要小分子RNA,在转录后阶段对靶标基因的表达进行调控,进而影响生物的生长发育。miRNA靶基因的鉴定是认识其工作机制的关键,但由于缺乏快速有效的实验手段和高准确度的预测算法,靶基因的鉴定已成为miRNA功能研究的瓶颈问题。本文利用miRNA靶标结合位点相关区域的特征信息,融合生物学先验知识,以及合理的模体特征假设,开发了基于miRNA靶标上下文的miRNA预测结果筛选算法。1.资源分析:对当前已有的miRNA及靶标相关数据库资源进行了总结,对现有miRNA靶基因预测典型算法做了全面的研究,剖析了各种算法采用的靶基因识别特征,根据已有的算法评测结果,以及实际预测非3’UTR区域靶标结果的分析,总结现阶段靶标预测算法存在的问题。2.数据收集:从权威数据库下载了人、小鼠和果蝇三个物种各188、73、22条微小RNA基因。从NCBI网站下载并利用perl脚本分析处理,从基因组数据中提取出3’UTR、5’UTR及CDS序列。通过文献挖掘,收集了三个物种共827条经实验验证的miRNA靶标数据,作为正样本集。利用miRanda, TargetScan软件预测获得非3’UTR区域的靶标位点信息,从中随机抽取1000条预测靶标数据作为负样本集。其中,600个正样本作为训练集,200个作为测试集。800个负样本作为训练集,200个作为测试集。3.特征提取:针对3’UTR和两类非3’UTR区域的靶标位点上下文区域,从生物学意义、序列结构、二级结构稳定性等角度进行特征选取,共选取17条备选特征。对备选特征的区分效力进行分析,最终保留了8种特征用于构建SVM分类器,包括靶标位点在当前区域定位、靶标位点上游/下游GC含量、上下游折叠自由能、3’UTR区域靶标位点上游/下游富集motif数量、非3’UTR区域靶标位点上游/下游富集motif数量。4.算法开发:利用网格搜索法对SVM分类器参数进行优化,并采用10倍交叉验证方法对获得的SVM分类器进行训练和评价,构建了微小RNA基因的靶标预测算法svMicroTar.对测试集的分析结果表明,针对真实靶标与5’UTR区域预测靶标的svMicroTar-5分类器的敏感度为80%,特异性为86%;针对真实靶标与CDS区域预测靶标的svMicroTar-c分类器的敏感度为60%,特异性为65%。可见svMicroTar算法可在一定程度上区分非3’UTR靶标,并改善3’UTR靶标预测的准确度,尤其对与5’UTR区域虚假靶标类似的靶标位点有较好的区分能力。通过结果格式转换,svMicroTar可应用于当前miRNA靶标预测算法的二次筛选,拥有良好的泛化能力。
其他文献
以文学想象台湾、书写台湾乃至有意经营种种关于岛屿的寓言,是台湾文学中的一个重要书写传统。台湾作家朱天心的《古都》从人类学与历史学结合的角度出发,通过文本中漫游者对
近代以来,越南北部民族地区的原生型宗教生态逐渐发展为天主教、福音教与各传统宗教并存并对后者形成强烈冲击的再生型宗教生态。在国际政治博弈、地缘社会与民族发展不平衡
目的探讨综合重症监护病房(ICU)脓毒症患者的发病情况。方法回顾分析2005-01~2006-12我院综合ICU入住病例912例,比较重症脓毒症、脓毒性休克和非脓毒症病例的临床特点,分析脓
[目的]探讨纾缓护理对脑恶性肿瘤病人生存质量的影响。[方法]采用SF-36量表对45例诊断为脑恶性肿瘤预计生存期不到几年的病人进行调查,然后对病人进行纾缓护理1个月,再用量表
日益复杂的会计环境与会计人才素质结构之间的矛盾日益显现,社会需要复合型、国际化、务实创新的会计人才,但目前这种高素质的会计人才供需失衡。本文试图探讨会计人才素质结
[目的]探讨团体心理训练对癌症病人配偶疲乏感及心理健康的影响,为促进癌症病人配偶心理健康提供依据。[方法]采用便利抽样法,选择2013年3月—2014年1月在大庆市油田总医院肿
目的观察分析文拉法辛联合阿普唑仑在治疗抑郁症方面的安全性与有效性。方法采用随机抽样法选取2016年1月~2018年1月在我院接受治疗的抑郁症患者112例,采用随机数字法将所有
伊朗立宪运动(1905—1911)之后,女性解放思潮在伊朗迅速发展,伊朗妇女走出家门,进入学校,接受现代教育,由此登上20世纪的文学舞台。在20世纪初叶的伊朗新诗运动、中叶的诗歌
作为一位私淑张爱玲的台湾女作家,朱天文作品中的日常书写被赋予了一种有意味的形式,使得她的小说中洋溢着一股审美气息。本文从对当下生活的感伤、对过去生活的留恋、对生老
猪繁殖与呼吸综合征(porcine reproductive and respiratory syndrome,PRRS)是世界养猪业的一个巨大的威胁。近年来,此病给各国养猪业造成了巨大的经济损失。本文立足于反向