论文部分内容阅读
一般认为同一物种的不同个体具有非常相似的基因组。然而,越来越多的证据表明,一种以拷贝数变异(Copy number variation, CNV)形式存在的结构变异可以导致个体间基因组的较大差异。CNV是指基因组片段大于1kb的缺失、插入、复制的DNA多态性,它被认为对丰富的表型多样性具有重要贡献。然而,其在水稻中的可塑性还未在基因组水平上进行研究。本研究利用比较基因组杂交芯片(Array-based comparative genomic hybridization, aCGH)技术创建了第一张水稻全基因组CNVs图谱,揭示出籼稻品种广陆矮4号和粳稻品种Nipponbare基因组之间存在高水平的结构多样性,DNA变异片段分析检测出两个品种间有多于600个CNVs序列。本研究通过将20份选自亚洲栽培稻不同类群的水稻材料与Nipponbare作比较,系统地进行了全基因组CNVs分析。通过一个详尽的筛选标准,保守地检测到遍及全部12条染色体的2886个CNV区域,覆盖序列长达10.3Mb(占水稻基因组的2.7%),包含2557个拷贝数缺失和276个拷贝数增加变异。CNVs发生和染色体长度无关,第11染色体上CNVs的丰富度最高。相对于Nipponbare为缺失的区域大多数(2175/2557)含有转座子以及其它重复序列。虽然每个位点的转座子类型的数量广泛地变化,但是LTR逆转录转座子占主要部分,其次是DNA转座子。我们发现57.8%(1668/2886)的变异仅出现在籼稻/粳稻,且多数出现于一个样本中。因此,亚种特异性CNVs富集于稀有变异,表明它们可能是比较新的变异,这与亚种内高水平的CNVs多样性这一结果相一致。发现一个变异存在于全部籼稻材料中,而在粳稻中没有共同的CNV,因此没有强有力的证据表明结构变异决定了籼粳亚种分化。值得注意的是,CNVs是基于比较粳稻参考基因组而得出的,那些存在籼稻但不存在于粳稻的序列不能被发现,因此,亚种分化相关的CNVs有可能出现于籼稻中,但没有在粳稻中。本研究鉴定并验证了不同类群间CNVs频率的显著差异,表明一些水稻CNVs可能独立出现于某一类群中,进而导致类群差异。聚类分析显示出水稻不同类群已知的亲缘关系。CNV功能分析表明,41.6%的CNV区域整体或部分影响1321个水稻基因。GO类别显著地富集于一些特异的生物学功能(p<0.001),例如细胞死亡、蛋白质磷酸化、防卫反应。许多基因是多基因家族的成员,由于存在基因组其它位置冗余的功能的缓冲作用,CNVs对数量性状具有更强的贡献作用。另外,相对于Nipponbare,不同的水稻材料缺失不同数量的基因,这表明CNVs中的基因在于驯化过程形成了可导致杂种优势的潜在作用。比较分析表明,受CNVs影响的多数基因在玉米和(或)拟南芥中高度保守,这与许多在其它物种中具有同源基因的结构变异基因源自古老祖先物种并在新物种形成时发生复制这一事实相符。本研究结果为水稻种质资源学研究除微卫星和单核苷酸多态性(SNPs)之外开发新的遗传变异提供了有价值的来源。全基因组关联分析鉴定候选CNV/基因将加速水稻复杂性状遗传学基础的研究,本研究认为CNV资源将与SNPs互补,为水稻表型变异和产量提高做出贡献。