论文部分内容阅读
从NCBI公共数据库获得262 113条甘蔗EST,通过前处理和聚类拼接得到全长为50 058.89 kb的无冗余Unigene 62 565条。在这些序列中搜索出9 482个SSRs,出现频率是15.15%;平均5.28 kb出现1个SSR。三核苷酸重复是主要的类型,占总SSRs的45.92%。CT和CGC是二、三核苷酸中的优势重复类型,分别占二、三核苷酸重复的21.22%和8.18%。此外还对筛选出的SSR进行多态性预测,得到了长度在20 bp以上的低级基元一、二、三核苷酸EST-SSR共1 405条