多序列比对软件T-Coffee的并行化设计与实现

来源 :2006年全国高性能计算学术会议(HPC 2006) | 被引量 : 0次 | 上传用户:woheni187170713
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
T-Coffee是广泛用于核酸或氨基酸的多序列比对工具.它通过生成基本信息库,扩展库,生成指导树,渐近式比对四个阶段来完成多序列的比对.本文分析了T-Coffee串行算法及其复杂度,并提出了基于SMP机的并行化版本.我们的目标是使其充分并行化,实验结果表明它明显的提高了性能,并得到了很好的相对加速比.
其他文献
多以太网卡并行通信是实现机群内部高效通信的重要手段,然而,受地址解析机制所限,现有的多以太网卡并行通信存在着依赖交换机绑定功能、不能主动控制通信负载、多网卡容错受限、网络配置复杂等问题.为此,本文提出并实现了一种面向机群并行通信的多以太网卡地址解析机制MARP,可有效支持单个IP地址和多个MAC地址之间的地址解析.测试结果表明,MARP与现有的以太网并行通信技术结合使用,可大幅提升机群通信的整体性
本文展示了一种在超级计算机上用扩散蒙特卡罗法(Diffusion Monte Carlo)解薛定谔方程的方法.这种方法可用于得到体系的基态零点能和波函数.本文基于扩散蒙特卡罗法中一种非常著名的算法--"随机游走"法(random-walk method),编写了相应的计算机程序,实现了一维谐振子模型的计算,并成功地将该程序扩展到多原子多维体系,应用于计算几种分子[CH5+、H3O2-、D3O2-、
随着税务数据向国家税务数据中心的集成,许多分布在各个城市的高性能服务器被闲置下来.我们利用这些闲置的服务器建立了一个基于开放的网格服务架构的省级税务网格.本文给出集成数据库、定义和构造基本的模块化网格服务以及采用Agent技术管理网格服务的具体方法.该方案使用面向服务的软件架构方法,成功地避免了资源浪费.实验证明它能极大地提高税务服务的质量.
随着遥感技术的快速发展,多源遥感图像的快速融合成为很多遥感任务的关键处理步骤.为了加速遥感图像的融合处理过程,本文首先提出了一种新的基于双树复小波变换的并行融合算法PACWT.算法中综合运用了数据分布、并行数据处理和负载均衡技术,以克服单机处理在计算能力和存储器空间上的限制;针对基于CWT的图像融合处理的计算特点,设计了一种可有效避免计算过程中数据通信的冗余划分方法.然后从理论上分析了算法在时间和
高性能集群具有大规模、廉价,高性能的特点,在提供给用户高性能的计算能力的同时,也给管理员对集群的管理带来了复杂性.目前集群管理系统还停留在管理员察看数据和事件并做出判断的阶段,给高性能集群的使用造成了庞大的管理开销.为了自动化管理员的操作,降低集群管理的复杂性,本文在分析大规模集群的自治需求的基础上,提出一种新型的集群自治框架, 提供整体化自治管理方案.通过使用中间件技术提供了良好的可扩展性和安全
随着峰值速度达280.6万亿次 IBM BlueGene/L 机群的投入使用,高性能计算机正面临着飞速发展,双核处理器的出现使得用户面临无处不在的并行.如何将已有的串行算法并行化并在并行计算机上实现成为高性能计算发展面临的迫切任务,本文尝试用OpenMP并行化gzip, 在机群的一个SMP节点(双CPU)环境下测试表明,性能得到了大幅度的提升.
矩阵运算是大规模并行应用中(如油藏数值模拟、天气预报等)普遍存在的计算形式,计算结果或计算过程中的矩阵常常是稀疏的.为了提高并行应用系统的效率,本文研究了针对大型稀疏矩阵的压缩通信问题.通过对矩阵压缩通信过程中矩阵稀疏度、网络带宽、处理器计算能力之间的关系进行定量分析,推导出稀疏度下界计算公式.通过对不同稀疏度情况下算法所取得的效率进行分析,总结出压缩通信中稀疏度与通信效率之间的函数关系.结合油藏
对于单晶硅磨削过程模拟的并行算法,依据C-SI系统的分子动力学模型及其特殊的特性,通过分析负载均衡和消息通信,利用"最小表面"原则,给出了一种空间分解并行方案.仿真实验证明算法可以平衡负载并且降低通信开销,同时,收集的对比实验数据证实了算法的有效性.
集群的动态负载均衡是网络计算的关键技术,如何提高动态负载均衡的性能,一直是网络计算人员研究的一个热点.本文研究的EJB容器集群负载均衡问题,其目的就是在互联网用户数和网络流量成几何级数增长的情况,J2EE应用服务器仍然能提供高可用性、高扩展性的服务.
HPCC基准由HPL、PTRANS、STREAM、Random Access、DGEMM、FFT、Latency-Bandwidth 等七大类共二十八项测试组成,它从多个角度对高性能计算机的计算、内存访问、网络传输等性能进行综合测评,较之Linpack基准更为全面.HPCC提供基本运行和优化运行两种运行方式.本文在HPCC介绍和参数选择讨论之后,给出了SGI4700上的部分测试结果.