基于反例选择的microRNA挖掘方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:coldbee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MicroRNA(miRNA)是一类长度约为22个核苷酸(nt)的非编码RNA,研究证实这类RNA基因在生物体内起着至关重要的作用。对miRNA基因的深入研究,有助于人们了解细胞中各基因的功能,基因间的网络调控关系,以及生物进化规律。近年来,miRNA研究已成为生物信息学领域的热点之一。本文所要研究的是目前生物信息学领域中有关miRNA的热点问题:miRNA挖掘以及其靶基因挖掘。  我们发现,目前基于机器学习的miRNA挖掘方法中对反例集(伪miRNA序列)的预测准确率普遍还不够高,会导致在大规模基因组进行挖掘时产生大量假阳性的样本,从而增加生物实验鉴别的成本。针对这一问题,本文对基于机器学习的miRNA预测算法进行了相关研究,研究内容包括:(1)提出了新的反例集的挖掘方法,并基于此方法在人类编码区中挖掘出了高质量的反例集,提高了现有预测模型的代表性;(2)设计有效的特征提取方案,结合所提取的代表性反例集提出了新的miRNA预测算法——miRNAP。通过实验证明,miRNAP较其他预测方法在特异性方面有明显提升,降低了假阳性。(3)通过融合miRNAP,我们在JAVA平台下开发了能够在大规模基因组中挖掘miRNA的工具包——mirnaDetect。同其他挖掘软件相比,mirnaDetect表现出优越的挖掘性能。此外,我们在文中还对miRNA靶基因挖掘等相关问题做了相关深入的研究探讨。
其他文献
随着在线服务网站的不断发展和日益普及,传统的购物方式已经逐渐延伸到虚拟网络环境中。电子商务网站独立于产品和服务,按照特定的交易规范为用户提供在线服务,称为第三方平
在多站点CSPS系统的协同控制问题中,系统的状态空间由多个站点的状态空间组成,其中每个站点的状态空间大小取决于其缓存库的容量大小,故系统状态空间的大小会随着站点个数的增加
随着虚拟现实、计算机图形学、计算机动画等技术的快速发展,数字化虚拟的人在工业设计、人机工程、医学人体仿真、3D电影和游戏等众多领域里得到了广泛的研究和应用。作为在计
面向服务的体系架构(Service Oriented Architecture, SOA)作为近年来IT业界的焦点,已经逐渐成为影响中国IT系统构建的主导思想。近年来发展迅速的Web服务技术具有的平台无关
无线传感网络是近年来快速发展的新一代的网络技术,随着其在军事、工业和日常生活中越来越多的应用,它的相关研究一直是当前科学技术研究中的热点问题。分布式探测技术源于航空
无线传感器网络是新一代传感器网络,是一门快速发展的高新技术,在安全监控、环境监测、健康医疗、前沿军事、精细农业、智能家居等领域具有广阔的应用前景。这种新的数据采集
由于信息安全问题的不断涌现,在公共安全、金融、商业等领域,基于生物特征认证技术的产品需求逐渐膨胀。说话人识别作为唯一适合远程认证的技术,逐渐被各个领域所接受,并开始得到
P2P(Peer-to-Peer,对等网络)流媒体技术充分利用了网络中的空闲资源,不需要改变现有的网络配置,具有很强的可扩展性,成为近年来流媒体分发技术和P2P技术中的研究热点。按照何种拓
Ad Hoc网络技术作为一种新兴的无线通信技术,逐渐进入人们的生活。由于Ad Hoc网络不依赖于预先存在的基础设施,因此与传统网络相比,具有更大的灵活性。Ad Hoc网络中的每一个
车载自组织网络(VehicularAdHocNetworks,VANET)是一种以车辆为节点的无线自组织网络,是目前MANET最具前途的应用领域之一。车载自组织网络的一个重要特征是车辆节点具有较高的