论文部分内容阅读
该研究发展了一种EST(expressed sequence tag)聚类方法(ESTClustering),用于分析大规模EST测序中所产生的大量数据,以获得高质量、非重复表达序列.该方法在聚类过程中采用MEGABLAST工具对一致序列进行序列同源比较,并用phrap程序对每一EST簇进行拼接检验.这一聚类策略能降低测序错误带来的影响,有效识别基因家族成员,并避免选择性剪接的干扰.与NCBI(National Center for Biotechnology Information)的UniGene c