利用基因芯片数据提取表型相关基因

来源 :北京大学 | 被引量 : 0次 | 上传用户:cerlin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对利用基因芯片数据提取表型相关基因进行了探讨。文章指出,基因芯片数据的众多应用中,一类非常普遍而且有意义的应用是利用基因芯片数据研究不同表型的细胞中基因的mRNA水平的不同,进而试图推测在基因水平上导致不同表型的原因。而这类应用中有三类非常普遍的数据:每种表型下具有多个独立样本的数据,不同表型细胞的时间序列数据和单个个体不同干扰条件下的表达数据。例如,世界上许多生物实验室都分别测量了癌变细胞和正常细胞中基因的表达水平,试图了解导致癌症的机理,希望对于癌症的诊断甚至治疗有所改进。有些生物实验室测量了某些物种在各个不同的发育阶段或者在进行了某种处理之后不同的时间点上的基因表达水平。试图利用这些数据研究某些因素对于生物的基因表达水平的影响。但是如前所述,基因芯片中存在着大量的噪声,所以本文首先考虑利用在每个表型下都具有多个独立重复样本的基因芯片数据提取不同表型中差异表达的基因。我们提出利用相对熵来解决这个问题,并将其应用到两个公共的基因表达数据,与目前使用频繁的其他方法比较,得到了非常好的结果。其次,本文考虑利用不同表型细胞的时间序列数据提取不同表型中差异表达或者说表型相关的基因。这一部分工作的出发点主要是来自于我们的合作者,中国科学学院遗传所,测量的水稻的芯片数据。我们利用聚类,非参数检验等统计方法非常具体地解决了从中挑选不同表型细胞中差异表达的基因。希望从这些基因出发,对基因之间相互作用关系有更深刻的了解。本文就如何利用不同表型细胞中的基因表达水平来挑选不同表型中差异表达的基因这个问题,给出了较好的解决方法。
其他文献
最优分红问题最初是由De Finetti在1957年第十一届国际精算会议上提出的.目前对于最优分红问题的研究已经有半个多世纪了,对于带布朗运动的风险模型的研究也比较完善.近来又引入了带常利率的风险模型的研究,但是随着市场的变化,利率也不是一成不变的,而是随着时间的变化而变化,因而本文着眼于对随机利率风险模型的讨论.本文在随机利率下,讨论了盈余过程是布朗运动风险模型的分红问题,对于threshold
“数字金融”是当今金融分析和实践的一个显著特点。这就是说我们在处理实际问题时,往往要建立适当的模型并进行定量的分析,运用计算机技术,给出“数字”上的分析结果,为规避风险
本文主要分为五大部分,第一部分主要是计算并证明了有限状态空间中相对熵指数收敛速度的特征方程,并将这种方法推广到计算一般的σ:=inf{D(f,ψ(f))/Ent(f)}的特征方程;第二部分
对于Zd上的简单随机游动,人们已经有了充分的认识.而在引入了点渗流模型之后,在开簇上的随机游动的常返性就需要重新考虑了.在这里我们只考虑上临界情形.本文中将证明,在点渗流
本文主要利用了迹类和核类来讨论完全0-单半群的同余。论文由五部分组成,由简单到复杂,由特殊到一般,借助同余对这一工具,刻画出完全0-单半群的各种性质,故得出了很多好的结论。
本文分为两个篇章:   第一篇考虑双曲型守恒律方程熵解的正则性。本文证明了当初始数据属于Ck除去一个第一纲子集时,守恒律的解是分片光滑的。值得一提的是从包含关系的含
编者按:上市公司并购重组,作为资本市场优化资源配置的一种有效手段,在我国经济结构调整和产业升级的进程中,正发挥着日益重要的作用。作为上市公司并购重组中的核心环节,并
小学美术教学“透视与构图”是美术学习的基本途径.培养小学生学习“透视与构图”是基础,.如果说把透视比作骨骼,那么构图就是肌肉二者结合,才会构成血肉丰满、栩栩如生的美
本文主要研究非线性椭圆型方程组。全文的内容可以分为三部分。   第一部分、非线性椭圆型方程组已有研究结果综述。在这一部分分别对Dirichlet问题和Neumann问题概述已有
资源是人类在地球上赖以生存的必要保证。作为可再生资源之一的鱼类资源,与人类生存息息相关。随着科技的发展,渔业产量不断增加。但它并不是取之不尽用之不竭的,如果人们不合理