论文部分内容阅读
对水稻基因组和全长cDNA序列分析发现三核苷酸重复(TNRs,Tri-nucleotide repeats)在水稻基因组中相当丰富,GC含量高的TNRs数量多,相同GC含量条件下,只有嘌呤或嘧啶组成的TNRs相对丰富,其中最多的CCG/CGG重复占总数的一半左右。TNRs在5’-UTR区域出现的频率最高,其次是编码区和基因上游侧翼序列区域。嘌呤丰富的TNRs偏好编码区,嘧啶丰富的TNRs偏好基因上游区域,也许是作为基因表达的调节元件。编码区内出现的密码子重复的第三位碱基的GC含量(GC3)高达90%,而且密码子重复主要编码丙氨酸和甘氨酸,并且发现,密码子重复主要出现在编码区的起始区域,可能编码区起始区域出现重复对蛋白功能影响较小,所以水稻中可以容忍如此多的TNRs。水稻中具有转录调节功能的基因最易含有TNRs,编码区内含有TNRs的基因尤其明显。暗示TNRs可能在基因表达、进化过程中起重要作用。 通过水稻基因组数据库,搜寻两个亚种(籼稻9311和粳稻Nipponbare)基因组序列的微卫星位点,在分析和比较多态性微卫星数量、长度、分布的基础上,我们发现了45220个具有特异侧翼序列的多态性微卫星位点;在籼稻基因组内平均每间隔8.3Kb一个多态性微卫星位点,粳稻基因组内为7.8Kb。发现内含子区域的微卫星最易出现多态性,其次是UTR和基因间区域,而编码区较少;DNRs和TNRs中除GC含量高的重复多态性都较好。我们还把来自Gramene上的微卫星标记和JRGP上的RFLP遗传标记资源整合到了两个亚种基因组序列上,构建了籼粳稻亚种全基因组微卫星多态性数据库,从而有便于它们的应用。随机挑选了100个多态性微卫星位点进行PCR扩增,并进行测序,结果表明,90%以上显示出序列多态性,从而证实这些多态性微卫星位点可作为标记,将为进行分子育种和基因定位等研究提供方便。这些微卫星位点可在我们的网站(http://www.wigs.zju.edu.cn/achievment/polySSR)上下载。 在籼稻9311基因组内发现了4607个加工假基因、2153个复制(duplicated)假基因和6720个假基因片段,Syngenta版本粳稻Nipponbare基因组分别为4320、2025和5989,国际水稻基因组计划完成的粳稻基因组分别为4034、1117和9304。初步分析发现,水稻中的假基因在着丝粒区域分布较为密集,加工假基因尤其明显。水稻中GC含量和基因密度成线性关系,而假基因和GC含量则没有这种关