论文部分内容阅读
基因芯片技术自从兴起以来,就受到生物学家和统计学家等多方面的高度关注。这篇论文的工作主要围绕基因芯片数据分析展开,其内容大概可以分为两个部分。第一部分讨论的重点是芯片数据标准化方法评价,具体研究了基因芯片数据标准化对芯片所测量到的基因表达水平之间相关系数的影响。第二部分侧重于一个实际芯片数据的处理,对中国科学院遗传所提供的超级杂交水稻基因芯片数据进行了初步的分析。下面分两段介绍一下这两个部分的大致内容。
在基因芯片实验中,基因表达水平之间的相关性在推断基因间相互关系时起到非常重要的作用。未经标准化处理的芯片数据基因之间往往都呈现出很强的相关性,这些高相关性一部分是由基因表达水平变化引起的,而另外一部分是由系统偏差引起的。对芯片数据进行标准化处理的目的之一是消除系统偏差引起的高相关性,同时保留由真正生物学原因引起的基因表达水平高相关性。虽然目前对标准化方法已经有了不少比较研究,但还较少有人研究标准化方法对基因之间相关系数的影响,以及哪种方法最有利于恢复基因之间的相关性结构。本文的第一部分通过对基因表达水平数据的模拟,具体比较了几种常用标准化方法的效果,从而给出最有利于恢复基因之间相关性结构的那种标准化方法。
水稻是人类赖以生存的最为重要的粮食作物之一,我国科学家在提高水稻产量研究方面做出了巨大贡献。利用华大基因研究中心设计的BGI-RiceChip-60K双色寡聚核苷酸水稻基因芯片,中国科学院遗传所设计了一系列芯片实验,以期对袁隆平超级杂交水稻进行基因水平上的深入研究。本文在第二部分对这些基因芯片数据进行了分析,挑选出了其中有差异表达的基因和可能对超级杂交水稻特殊发育过程有影响的信号转导途径。这些知识将有助于生物学家更加深入的了解杂交水稻高产的生物学机理,从而为世界粮食安全做出更大贡献。