基于生物信息学应用的混合架构集群系统研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:babyjoyce
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从全基因组测序成为可能以来,基因组结构注释(包括了解基因组DNA中的基因组成、结构及其调控元件)成为生物信息学研究的重要问题,由于基因组结构注释系统的计算量庞大,需要基于高性能计算资源进行基因组结构注释计算。目前生物信息学研究机构普遍采用的高性能计算系统主要存在以下两方面问题:搭建成本高昂,性价比差,对预算有限的实验室是沉重负担;技术标准不开放,导致软件管理困难,硬件扩展性不佳,后期维护成本高昂。针对以上问题做了如下工作:搭建了一个适合生物信息学应用的基于开源集群资源管理中间件OSCAR的集群系统。对目前的硬件技术进行分析,在此基础上根据需求对硬件选型,特别针对目前统一架构集群的不足提出PC/SMP服务器混合架构的方案。对集群相关的软件进行了实验和选型,重点是集群资源管理中间件,选型过程中做了大量实验来测试系统的兼容性。对选型后的硬件和软件进行了系统集成,并对系统并行计算环境进行了测试。在集成过程中,克服了Linux软件的包依赖性等技术困难。使用国际标准的Linpack对集群的浮点计算性能进行了测试,对结果进行了分析和总结,验证了集群的计算性能和可扩展性是否符合要求。开发了求DNA-C/G含量的PBS程序cgpbs,对生物信息学者在集群系统的并行计算环境下部署复杂的生物信息学软件进行了一定探索。
其他文献
随着数据库技术的广泛应用,数据管理的对象从非结构化数据向结构化数据延伸。依赖于图数据结构强大的表述能力,一些新兴数据库如XML文档数据库、社会关系网、化合物分子数据库
目前的数据库应用系统管理的数据大部分是与时间有关的,数据仓库就是一个很好的例子。通常把具有一种时间属性的数据称作是时态数据,时态数据的时间属性是指有效时间或事务时
在信息时代的今天,随着网络技术和多媒体技术的高速发展和广泛应用,越来越多的信息在网络上迅速方便地传输,但这同时也带来了信息安全隐患问题。因而,如何保护信息安全成为国
本文首先以QR二维条码为例,探讨了二维条码图像的定位与分割算法,利用Radon变换与Sobel边缘检测算法将条码图像从原始条码图像中有效地分割出来;然后分析了经过光学系统的条码图
集成了传感器、微机电系统和网络三大技术而形成的传感器网络是一种全新的信息获取和处理技术。随机分布的大量传感器节点,以无线自组织的方式构成网络,通过节点中内置的各种类
当前,大量的Web应用都采取了快速迭代的开发方式,产品需求时常发生改变,产品的前台界面和后台业务逻辑通常也会随之改变。因此,需要进行大量严格的回归测试,验证功能是否能完
由于采用了联合检测、智能天线等关键技术,TD-SCDMA 系统相对于WCDMA 和 CDMA2000 具有最好的频谱利用率,因此 TD-SCDMA 的相应关键技术是现在各个公司研究的重点。其中联合检
随着多媒体技术的快速发展,视频数据大量地增加,基于内容的视频检索的应用越来越广泛,而关键帧提取技术是视频分析和基于内容的视频检索的基础。一个镜头的关键帧就是反映该镜头
随着电子商务的发展,电子支付安全问题已成为人们日益关注的热点。常用的电子支付的协议有SSL协议和SET协议。基于SSL协议的电子支付系统成本低、应用简单透明、相对简单且快
Google Scholar为我们搜索各种来源的学术文献信息提供了一个简单易用的平台。它使用网络爬虫来把各种来源的文献信息集中存储到Google自己的数据库里,然后通过web向用户提供