基于支持向量机的在全基因组范围内建立预测调控网络的研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:litang345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着后基因组时代的到来,当今对于生物基因组序列一级结构的了解还远远不够,还必须明白其中基因是怎样组织起来的,每个基因的功能是什么,又是怎样随发育调控和微环境因素的影响而在特定的时空域中展开其表达谱的。在细胞和生物体生长、分泌、细胞系定向等过程中,基因表现的转录水平调控是非常重要的一个环节,转录因子在物种进化中起着很重要的作用,而基因调控网络表现的是大量基因受到转录因子的调控而最终转录翻译为蛋白质进而实现生物功能的复杂信息,是人们理解生物过程和基因功能的重要内容。对于全基因组范围内转录因子(transcription factor)的调控网络确立变得尤为重要。在一般情况下,面对海量般的基因序列数据,传统的基因鉴别技术成本昂贵、复杂、检测灵敏度较低,重复性差,并且这种基因芯片技术远远不能满足研究现状,此时使用机器学习方法对生物数据进行数据挖掘已经成为生物学研究的一种新方法,本课题主要利用支持向量机方法,结合已知的转录因子数据,解决生物信息学中全基因组中预测建立调控网络的问题。针对基因序列的复杂性,运用支持向量机的方法,通过对已知的酵母菌转录因子及其对象的研究,独创性地对酵母基因组序列进行了降维,结果表明降维后的转录因子数据同样可以有效的表达转录因子对的特性,从而对于找到其他转录因子对有很大的帮助。利用已有文献报道的实验数据信息,对酵母的全基因组调控网路进行了预测。通过对转录因子序列的有效降维,结合支持向量机技术,我们取得的预测结果超过以往一些聚类分析的算法。
其他文献
通信技术、嵌入式技术、传感器技术的飞速发展和日益成熟,使得无线传感器网络成为当前的一个研究热点。与传统网络相比,传感器网络具有以下特点:节点分布极其稠密且数目很大;
近年来,P2P(peer-to-peer)技术成为人们研究和关注的焦点,以Napster、Gnutella、BT、MSN、pplive为代表的P2P应用软件日益流行。信息共享是其最为常见的一种应用。在P2P共享
随着计算机图形学的发展,虚拟现实技术逐渐成为研究的热点和焦点。作为虚拟现实技术的重要组成部分,三维人脸建模有着越来越广泛的应用。目前该技术被广泛应用于影视制作、游
随着互联网技术的发展,Email已日益成为人类日常生活中必不可少的通信方式之一。人们之间的Email通信产生了大量的通信数据,从这些数据中挖掘出人类社会的社群结构并且分析社
随着网络使用的普及以及信息技术的不断进步,Web软件已成为一种主流的应用模式,如何确保Web软件的可靠性显得越来越重要。Web软件的特征是:用户数量大、代码量大、页面众多且
基于动态信息的城市交通诱导策略(简称为:路径诱导策略)是智能交通系统(IntelligentTransportation Systems,简称ITS)研究的一个重要方面,旨在通过向驾驶员提供基于实时交通信息
随着国际交流的日益频繁,翻译学学科地位不断提升,互联网搜索引擎辅助翻译得到不断的发展。传统的搜索引擎是基于关键词匹配的方式来进行信息检索,但是各个国家的自然语言中
基因识别是指采用生物学实验或计算机等手段来识别DNA序列上的具有生物学特征的片段,是生物信息学的一个重要分支。启动子是DNA序列上的一段重要的基因调控序列,标志着转录起
伴随着Internet技术的发展,WWW的应用也越来越多,Web站点越来越普及。在当前竞争激烈的网络经济中,只有赢得用户才能获得竞争中的优势。客户浏览行为的数字化,使得通过收集大量用
背包问题属于NP难问题,解决背包问题是解决组合优化所面临的问题之一,在现实中有着广泛的应用背景,开展对解决复杂组合优化问题的算法研究具有一定的理论意义和实用价值。本