论文部分内容阅读
莲为多年水生草本植物,也是一种重要的经济植物。莲在中国南北各地被广泛种植,武汉、杭州等地的品种尤多。根据莲各部位的用途可以将莲分为:根茎莲,种子莲和花莲。莲藕是莲的贮藏器官也是它的主要经济器官,了解其发育机理,将为莲栽培与育种提供理论依据。莲藕的发育是一个复杂的过程,它可以分为四个阶段:匍匐茎阶段(在单一方向上伸长),初始肿胀阶段(纵向生长停止并开始增加周长),中间肿胀阶段(根茎继续肿胀,并且淀粉逐渐积累),后来膨大阶段(根茎停止增大,淀粉迅速积累)。尽管莲藕膨大机制受到了极大关注,但其分子形成机理仍没有得到解析,膨大基因也难以挖掘。目前,最常用的膨大相关基因挖掘方法是从转录组数据入手,根据基因表达量的变化找出差异表达基因。但是,该方法通常忽略了在莲藕膨大过程中表达量变化小而起至关重要作用的基因。在本研究中,我们通过莲不同组织以及莲藕各阶段的转录组测序数据,应用样本特异性网络分析方法,挖掘了莲藕膨大的关键基因。首先,从NCBI数据库下载莲11个不同组织以及莲藕匍匐期、中间肿胀期、后来膨大期三个发育时期的测序数据。其次,应用HISAT2将reads比对到参考基因组上,SringTie组装转录本并量化基因的表达水平,从而得到基因表达矩阵。然后,利用莲11个不同组织共47个样本的基因表达矩阵构建参考网络,莲藕三个发育时期共6个样本的基因表达矩阵构建扰动网络,即不同发育阶段的莲藕特异性网络。最后,构建莲藕三个不同发育阶段的差异网络,并通过差异网络分析实现膨大基因的挖掘。研究结果发现,莲藕中间肿胀期与匍匐期的差异网络包含427个基因,后来膨大期与中间肿胀期的差异网络包含1222个基因,后来膨大期与匍匐期的差异网络包含1284个基因。对后来膨大期与中间肿胀期差异网络中的基因进行富集分析发现,在生物过程方面,这些基因主要富集在有机物代谢过程、初级代谢过程、嘌呤核苷单磷酸代谢过程等;在细胞组分方面,这些基因主要富集在大分子复合物、细胞内组分、细胞质等;在分子功能方面,这些基因主要富集在苏氨酸型内肽酶、RNA聚合酶活性等方面。并且在这些基因中发现了与淀粉相关的基因11个、糖代谢相关的基因1个、细胞分裂相关的基因11个、细胞形状相关的基因9个。此外,本文使用样本特异性网络的方法构建了莲叶,花瓣,莲藕的组织特异性调控网络。在这三个组织特异性网络中分别选出度值较高的前十个基因作为莲叶,花瓣,莲藕的组织特异性候选基因,通过分析发现在莲叶中度值高的基因大多为类叶绿体基因;在花瓣中发现度值高的基因与氧化酶、乙酰辅酶A有关;在莲藕中发现度值高的基因与液泡、中性神经酰胺酶有关。样本特异性网络使用基因互作分析手段挖掘了莲藕膨大的关键基因,为植物学研究提供了新思路。它可应用于样本量较少的植物网络构建,也可用于寻找抗逆的关键基因,控制不同花色的重要基因,不同发育阶段的组织特异性基因等,这将有助于植物学的后续研究工作开展。