论文部分内容阅读
水稻在生长的过程中受到干旱、盐等非生物逆境因素胁迫,会造成大面积的减产、品质下降甚至坏死。寻找与水稻的抗逆相关的关键基因,对提高水稻在逆境胁迫条件下的生存能力有重大意义。基因芯片技术的出现到飞速发展为水稻的抗逆性研究提供了一个新的技术平台。基于分子生物网络对高通量的基因表达数据进行分析和挖掘成为当下生物信息学的研究热点。本文针对水稻基因表达数据的特点,开展了基于加权基因共表达网络挖掘水稻抗逆基因的研究,主要结果如下:(1)基于经验贝叶斯理论的Limma算法提取水稻差异表达基因。水稻基因表达数据维数高达5万多,对其进行预处理并且筛选出差异表达基因有助于挖掘生物学意义明确的信息基因。本文引入limma算法,基于样本特征向量对基因表达向量进行线性拟合,并对拟合结果进行经验贝叶斯检验,最后通过对基因表达变化倍数和显著性差异P值设定合理的阈值,来提取水稻差异表达基因。(2)基于加权基因共表达网络(WGCNA)挖掘水稻抗逆相关基因模块。基因共表达网络是以基因表达的相似性为基础而构建的分子生物网络,网络中致密的连通子图往往具有特定的生物学功能。本文基于WGCNA构建水稻差异表达基因共表达网络,并通过分层聚类算法从网络中挖掘基因模块。进一步,利用基因模块特征值和样本表型之间的相关性,以及基因模块的显著性识别与水稻抗逆性相关的基因模块。在水稻基因芯片数据集GSE14403和GSE26280中,分别提取了耐盐相关基因模块和抗旱相关基因模块。(3)水稻的抗逆基因挖掘。采用DAVID在线分析工具,对获取的水稻抗逆相关基因模块进行基因功能富集分析。其中,在耐盐相关基因模块中发现有8个与盐胁迫响应相关的基因,在抗旱相关基因模块中有9个与水胁迫响应相关的基因。结果表明,本文方法能有效挖掘出具有生物学意义的关键基因和基因模块,为植物抗逆性研究提供新的视角。