虚拟筛选海量并行任务管理系统中数据流的管理

来源 :兰州大学 | 被引量 : 0次 | 上传用户:yzz133
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虚拟筛选是在计算机上针对特定靶标蛋白筛选出最合适的候选药物的过程。随着网格计算技术的发展,科学家越来越倾向于利用网格环境进行药物的大规模虚拟筛选以减少新药研制的成本和时间。大规模虚拟筛选涉及海量数据,待筛选的小分子化合物通常数以百万计。在网格环境下进行基于分子对接的大规模虚拟筛选应用,通常的做法是科学家手动查询小分子化合物并分组,在网格平台上编辑多个对接作业依次对分组进行计算,手动下载所有对接结果。虽然利用了网格强大的计算能力,但是科学家的工作非常复杂和繁琐,并且需要学习大量计算机领域知识。以CSGrid网格平台为基础设计的海量并行任务管理系统,目的是实现大规模虚拟筛选应用在网格平台上的自动执行,从而将科学家从繁琐的工作中解脱出来。海量并行任务管理系统将虚拟筛选应用分成多个并行作业在网格平台上计算,作业流和数据流的管理非常重要。本文的研究重点,就是如何设计系统中的数据流管理功能,制定合理的数据流配置策略,使海量数据流配合并行作业调度策略,实现网格环境下大规模虚拟筛选应用的高效自动运行,提高网格资源的利用率。本文设计的数据流管理功能由三个模块实现。第一个模块是查询条件定制接口,该模块为用户提供了一个定制数据查询条件的图形编辑器:第二个模块是数据查询、分组及传输Web Service,该模块从分布式小分子化合物数据库中查询出符合条件的小分子化合物,按可旋转键数排序并分组,再将分组上传至需要数据的网格节点。第三个模块是统一数据管理空间,该模块提供了所有网格节点数据的全局视图,可以实现虚拟筛选结果的并行下载。本文重点从用户体验和实现技术方面对各个模块进行了深入的探讨。
其他文献
计算机安全一直受到大家的关注。网络安全问题是研究人员探讨的重点,许多成熟的技术随之而诞生,网络侦听、数据包过滤等等。然而网络安全威胁的目标依然是计算机系统本身,计
在现代社会中移动通信已经成为非常重要的通信手段,而移动基站是移动通信的核心设备,为了提高移动通信的覆盖面积和通信质量,城市中分布成千上万的基站,如何维护这些基站以确
近年来,随着计算机技术的发展,特别是计算机硬件设备以及网络连接技术的不断成熟,一种新的计算模式-普适计算(PervasiveComputing)越来越引起计算机科学界的关注和重视。普适
随着磁共振成像(Magnetic Resonance Imaging,简称MRI)技术在世界上的高速发展,MRI在临床医学上已得到了普遍的应用。谱仪是MRI系统的核心设备,射频发生电路是谱仪中的一个重要模块,在序列运行过程中输出频率、相位、幅度、波形及脉宽可控的射频脉冲,以产生磁共振成像所需的B1场。随着高场磁共振系统(1.5T及以上系统)的普及,射频信号的波长已接近人体组织的尺寸,因此射频脉冲对
虚拟现实技术通过对虚拟世界的创建模拟真实世界的体验,是由计算机建立的一种多源信息融合的交互式仿真系统,广泛的应用于医疗事业,军事航天,工业设计,教育培训,地理交通和游
如今,大量流媒体应用出现在网络之中,如网络球赛直播、网络视频点播和在线音乐等。而流媒体的占用高带宽、持续性长、QoS要求高的特点使得传统的C/S模式或者CDN架构难于支撑大
计算机化学是应用计算机技术进行化学研究的学科,计算机化学深受当今计算机与网络通讯技术飞速发展的影响,处在不断发展和演变之中。随着计算机化学所研究问题的复杂性越来越高
视频跟踪主要包含目标表示和目标定位两部分。比较常用的目标表示方法是颜色核直方图,它采用核密度估计(Kernel Density Estimate)方法估计目标的颜色概率密度分布函数。以颜色
高光谱图像技术的不断发展,使我们能够轻松获得丰富的地物信息。而图像分类作为高光谱图像处理之中重要的一环,受到了极大的关注。最小正则子空间分类算法,一种基于线性表达的模
随着Internet的快速发展,人们越来越希望能够在庞大的网页库中快速准确地找到自己想要的信息,全文检索技术应运而生。它对文档的全部文本数据都建立索引并提供检索,目前已逐