时序基因表达数据分析中的优化模型及算法

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:liongliong445
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物技术,尤其是高通量技术的飞速发展,生物数据的产生、积累数量大规模提高。如何分析、挖掘生物数据中隐藏着的丰富的信息越来越受到人们的关注。时序基因表达数据反映的是基因在不同时刻的表达情况,它能够更精确的刻画不同生物过程、同一生物过程的不同阶段的基因表达水平,更加符合实际情形,对于研究生物过程的动态性、多样性有重要的意义。而在研究基因表达数据的领域中,聚类问题和网络推断问题占据着重要的地位,一直是研究的热点。本文利用了最优化,尤其是非线性优化的模型及方法,来研究时序基因表达数据的双向聚类和局部网络推断问题。主要包括如下内容:   基于模糊c均值算法,提出了基于距离相似性的双向聚类模型,能够找到具有一般性模式且具有“模糊”性的双向类。在求解这种复杂非线性模型的过程中,利用了爬山法来分别求解不同的变量,并且设计了在庞大解空间进行搜索的初值选取方法。通过在模拟数据和实际数据中的计算,验证了算法的可行性及结果的生物意义。   结合了比对和离散化的思想,提出了一个针对时序基因表达数据的双向聚类模型,能够找到相似、互补、延迟等各种相关的局部表达谱特性。不仅能够精确的求解大规模的问题,而且避免了调节参数的影响。在计算实际问题时,我们分别从生物网络,调控关系,功能注释,划分细胞周期等方面阐述了模型计算结果的意义。   利用一个非线性规划模型来推断局部的基因调控网络,不仅可以得到遗传上的基因相互作用关系,而且可以发现随时间不同网络结构的动态变化情况。在求解模型时沿用了前面的爬山法和初值选取规则。最后通过计算模拟的和实际的数据来阐明模型的优越性。
其他文献
数学思想是对数学知识、方法、规律的一种本质认识,数学方法是解决数学问题的策略和程序,是数学思想的具体反映,数学知识是数学思想方法的载体。数学思想较之于数学基础知识
求真务实,一直是我们党强调和提倡的,也是老百姓十分关注的。求真,就是要以不断探索和创新的精神去了解事物的本质,把握事物的发展规律,制定正确的决策;务实,就是要脚踏实地
后进生转化是小学数学教学中的主要任务之一,也是提高数学课程教学效果的有效途径.本文就如何在小学数学中转化后进生提出了几点策略,包括巧用导入,激发兴趣;寻找亮点,提升自
10月28日~30日,2008第四届国际流体机械展览会于美丽的首都北京国际展览中心拉开帷幕。这是国际流体机械专业展览史上规模最大、水平最高、专业化最强的国际流体机械展览,本届
本文考虑具有内在自由度的不可压缩流体的一个数学模型,研究了该模型解的存在唯一性,正则性和大时间性态.本文共分七章。   第一章为绪论.我们扼要地介绍了模型的相关物理背
本文主要介绍高振荡微分方程的数值解法。   第一部分介绍线性高振荡问题。考虑系统y+g(t)y=0,其中lim1→∞ g(t)=+∞。Iserles利用Magnus展开方法详细研究了该类方程数值
在第一章中,首先定义了微分算子Ikp,然后利用这个算子Ikp引入了两类p叶亚纯函数族∑(S)*p-1(k,α,β)及∑(C)p-1(k,α,β),应用分析的方法和技巧得到这两个函数族的系数不等
研究算子逼近问题最重要的工具之一为Baskakov算子,因其良好的逼近性质吸引着众多专家学者对其进行详尽的研究,使其在函数逼近论领域里的应用越加广泛。  本文主要探讨一类广
“三个代表”重要思想确实反映了我国广大人民群众的共同愿望,体现了当今世界和中国发展的时代精神显示了马克思主义理论的强大力量。它之所以成为全党全国人民在新世纪新阶
本文在广泛用于因果推断的基本理论--虚拟事实模型的框架中,主要研究不完全数据情况下基于协变量分层和主分层的平均因果作用的识别性。论文集中讨论两种情况:一种是作为分层的