论文部分内容阅读
国际水稻基因组测序计划(International Rice Genome Sequencing Project)采用以物理图为基础的随机测序战略,作为该计划的一部分,中国科学院国家基因中心承担了水稻第四号染色体精确序列的测定任务。本研究论文首先报告了构建水稻第四号染色体精细物理图的战略和技术方法,以及在该研究中所采用的一些独创的方法,使得我们能够快速准确的构建了高精度高覆盖率的第四号染色体物理图。其次,本研究还对水稻第四号染色体着丝粒的精细结构进行了鉴定和分析。同时,还开展了籼粳栽培稻的比较基因组研究。通过整合114个已经测序的相近亚种籼稻广陆矮四号的BAC克隆序列、182个RFLP和407个EST分子标记、日本晴基因组指纹图数据和多种物理图构建方法,构建出水稻粳稻日本晴第四号染色体基于BAC克隆的精细物理图。这张物理图共包含4个重叠群,总长度为35.78Mb,覆盖了整个染色体的99%,并覆盖了完整的着丝粒区。端粒克隆、着丝粒克隆以及重叠群之间空缺的大小都经过粗线期染色体荧光原位杂交鉴定。通过计算遗传图距和物理图距的比例以及荧光原位杂交的结果,发现第四号染色体的短臂和长臂近着丝粒区是重组抑制集中的区域,也是第四号染色体上异染色质化的区域,约占整条染色体的45%,说明了这条染色体的测序难度较大。这张物理图是利用两个相近亚种的整合数据快速准确构建物理图的第一个成功例子,也为第四号染色体的精确测序提供了基础。利用相似的策略,我们还构建了籼稻广陆矮四号的第四号染色体物理图,目前覆盖率已经超过65%。在物理图提供的序列基础上,对于籼粳稻两个主要栽培稻亚种进行了比较基因组分析,在2.3Mb对应区段中发现了两个亚种在基因组成和顺序上存在的广泛的微共线性,两者之间的差异主要由插入/缺失和单核苷酸多态性造成,这些差异可能影响基因的结构和表达,从而对种间表型差异产生影响。染色体着丝粒的完整序列对于研究着丝粒的功能非常重要。在物理图构建的过程中鉴定了覆盖水稻第四号染色体着丝粒的重叠群,并对这个重叠群进行了测序,获得了第一个完整的水稻染色体着丝粒序列结构。水稻第四号染色体<WP=5>着丝粒的124kb完整序列,是由379个串联重复的CentO卫星组成的18个片段和19个着丝粒逆转座元件组成,没有发现其它特异性序列。18个CentO片段被19个逆转座元件隔开,两者间隔排列,其中4个CentO片段(65个CentO单体)与其它片段方向相反。四号染色体中的着丝粒逆转座元件可以分为四类,其中,第一类的逆转座元件显示出对水稻着丝粒更高的特异性。着丝粒逆转座元件倾向于插入CentO重复的特性显示出它们在进化上对着丝粒的扩张的作用。在第四号染色体着丝粒中找到的三个完整的逆转座子说明它们可能通过一种转录介导的机制对有功能的着丝粒的形成发挥作用。水稻第四号染色体着丝粒的完整序列是高等生物中完成的第一条染色体着丝粒序列,为研究着丝粒的功能提供了结构基础,也为构建植物或者水稻人工染色体提供了必需的序列信息。