SSCMDA:基于间谍刺探策略与超级集群策略的MiRNA与疾病关联预测模型

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:nilaomei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物学领域,识别microRNA(miRNA)与疾病之间的关联性对于临床医疗具有极其重要的意义,因此构建miRNA与疾病关联网络受到生物科学界越来越大的关注.然而,现今在这方面的研究主要是依赖先进的生物学仪器以及专业前沿科学家的实验观察而得出结论的,这样的研究方法是昂贵的并且及其耗费时间的.近些年来,数学以及计算机信息相关领域的科研工作者越来越关注生物信息学的发展,并致力于将统计学习等智能算法应用于生物大数据分析相关的前沿交叉学科方向.本文正是基于以上学术领域背景提出了基于正则化最小二乘法分类器的间谍刺探策略与超级集群策略,并通过结合该双层策略形成最终的miRNA与疾病关联预测模型SSCMDA.该模型将miRNA与疾病已知关联数据以及疾病结合相似性、miRNA结合相似性等经过充分数据挖掘的相似性信息作为输入数据,并首先设计实施了间谍刺探策略从miRNA与疾病的未知关联中识别出高可信度负样本,一定程度上解决了既含有潜在正样本又含有真正负样本的混合训练样本导致预测结果不准确的问题.此外,超级集群策略能够尽可能多地增加高可信度的正样本,从而通过克服缺少足够正训练样本的问题进一步提高预测的准确性.通过实施三种交叉验证,即全局留一交叉验证、局部留一交叉验证以及五折交叉验证,得到的AUC值分别为0.9007,0.8747以及0.8806+/-0.0025.通过将SSCMDA模型的AUC结果与一些早期模型进行比较,SSCMDA模型对miRNA与疾病关联预测的精确度得到了明显的提升.我们进一步在不同版本的HMDD数据库上实施了案例分析来测试SSCMDA模型预测能力的鲁棒性.我们同时实施了仿真案例分析来检验SSCMDA模型对没有已知相关miRNA的新疾病的预测效果.所有案例分析的实验结果表明,SSCMDA模型预测的大部分具有高置信度的miRNA与疾病关联能够被生物实验所验证,从而进一步证明了SSCMDA模型良好的预测能力.
其他文献
图像作为人类感受与认识世界主要方法,与我们的生活密切相关。而提取图像中关键有用信息进而协助人类研究才是图像本身的价值所在,所以数字图像处理技术便成了计算机领域一个
本文面向RoboCup中型组足球机器人比赛,根据比赛对机器人系统提出的更高要求,在国防科技大学NuBot机器人团队五代足球机器人的技术积累上,设计了第六代NuBot足球机器人系统,
在日地空间物理的研究中,极光是唯一可以通过肉眼观察到的地球物理现象。合理的极光形态分类对研究各类极光现象与地球磁层动力学过程之间的关系十分重要。随着我国极区高空
随着信息技术的飞速发展与广泛应用,Internet中产生了巨量的文本信息。如何从这些文本信息中提取出有用的信息是目前国内外研究人员重点关注的课题之一。关系提取是信息提取
近年来,随机非线性互联系统因其复杂的属性及其在实际工程中广泛的应用,使得该类系统一直都是控制领域中一个热门的研究课题。虽然吸引了国内外学者的关注和研究兴趣,但随机
随着新兴的网络视频相关服务和设备的兴起,例如视频共享、视频广播、广告和视频推荐等,网络视频的数量急剧增长。越来越多的用户参与到视频相关的活动中,包括上传和下载视频,
随着信息技术的高速发展,图像作为一种描述目标物体十分形象有力的表达方式,慢慢变成从业者获取信息、分析信息和利用信息的重要手段。经过这些年的发展,深度学习方法取得了
通常信号的相位和振幅信息是研究人员判断正确信号的重要依据,但在衍射成像等领域下,一般光学监测设备仅能测得图像的傅里叶变换的振幅信息,往往还被噪声所污染,这就影响了研
近几十年来,网络控制系统(NCSs)在控制和通信科学领域受到了广泛的关注和重视。所谓网络控制系统,即系统装置信息和控制器信号通过数字化、智能化的网络通信通道进行传输的闭
面对新一代移动互联网的浪潮,电信运营商的竞争和挑战前所未有。提供客户的新服务竞争力将成为运营商生存的关键。电信客服平台作为海量的客户接触部门,其海量的数据中蕴藏着