Gclust:A Parallel Clustering Tool for Microbial Genomic Data

来源 :基因组蛋白质组与生物信息学报(英文版) | 被引量 : 0次 | 上传用户:orientaladam
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
The accelerating growth of the public microbial genomic data imposes substantial bur-den on the research community that uses such resources. Building databases for non-redundant ref-erence sequences from massive microbial genomic data based on clustering analysis is essential. However, existing clustering algorithms perform poorly on long genomic sequences. In this article, we present Gclust, a parallel program for clustering complete or draft genomic sequences, where clustering is accelerated with a novel parallelization strategy and a fast sequence comparison algo-rithm using sparse suffix arrays (SSAs). Moreover, genome identity measures between two sequences are calculated based on their maximal exact matches (MEMs). In this paper, we demon-strate the high speed and clustering quality of Gclust by examining four genome sequence datasets. Gclust is freely available for non-commercial use at https://github.com/niu-lab/gclust. We also introduce a web server for clustering user-uploaded genomes at http://niulab.scgrid.cn/gclust.
其他文献
BackgroundrnProtein-RNA interaction is ubiquitous in cells and serves as the main mechanism for post-transcriptional regulation. RNA binding proteins (RBPs) not
期刊
We propose a computational workflow (I3) for intuitive integrative interpretation of complex genetic data mainly building on the self-organising principle. We i
引言随着民航“十一五”建设的有序推进,机场建设和空管设备的规模不断加大,空管系统设备的运行保障能力逐步增强。同时,新辟航线和飞行流量的增加,也使得空域结构优化调整的
随着地球空间信息学的提出及其迅速发展,传统测绘科学技术的内涵与外延都发生了巨大的变化。这必将导致高校测绘科学技术教学理念的进一步完善与教学改革向纵深发展。测绘仪器
会议
随着地球空间信息学的提出及其迅速发展,传统测绘科学技术的内涵与外延都发生了巨大的变化。这必将导致高校测绘科学技术教学理念的进一步完善与教学实践向纵深发展。本文研究
阐述了城市化、数字城市建设以及测绘工程在城市建设过程中的作用,提出了培养服务城市规划、城市建设、城市管理的测绘工程专业应用型人才的思路,并在此基础上提出了服务城市建
本文首先介绍了测绘工程现状及其对人才的需求,探讨了国内测绘工程专业的调查与分析,制定了专业定位与人才培养目标。
如何培养适应时代发展的测绘人才,为了培养全面的测绘人才应该如何改革专业培养模式,是摆在高校测绘专业教育者面前的一个深刻问题。本文针对测绘工程专业培养模式及教学改革,联
通过对高等农林院校测量学教学问题的研究,以建立数字化测绘实验、实习基地为基础,以网络教学、多媒体教学、电化教学等多位一体的教学方法为手段,以数字测图、绘图、用图相结合
会议
民族班学生的一些特殊性,决定了对他们的授课不能采取通常手段。本文作者根据多年从事测量的教学经验,总结了民族班测量教学的一些教学经验,希望和各位同行们一起探讨。