基于云计算技术的化合物相似性分析系统

被引量 : 0次 | 上传用户:liubingonline
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着整个社会各行各业信息化进程的发展,信息数据呈现了爆炸式地增长,对相关的信息存储、处理和管理技术也提出了更高的要求。而云计算通过网络将超大规模的计算和存储资源整合成计算资源池并以按需服务的方式提供给用户,有效地满足了海量信息存储和处理的需求。在药物设计领域,利用计算机虚拟筛选发现具有生物活性的化合物是一种重要的研究方法,其中一种筛选方法是将功能未知的分子与功能已知的分子进行结构比较,根据它们的结构相似性特征来预测该未知分子的生物活性,它大量应用于新药研发和新型化学物发现过程中。随着化合物数量的增加,药物筛选计算需求急剧增长,这就对计算系统处理技术提出了更高的要求,传统的单台机器处理方法具有很大的极限性,而云计算技术的特点为这个问题提供了潜在的解方案,在这种情况下,如何将云计算技术应用到计算机虚拟筛选中成为值得研究的课题。本文研究了云计算的相关理论、特点和关键技术,探索了分布式数据处理编程模型MapReduce以及其开源实现Hadoop的运行机制和原理,针对分子结构比较问题提出了一个分布式解决方案。主要做了如下研究:1)研究了云计算相关技术和分子相似性比较算法,结合Hadoop云计算技术的优点,针对Hadoop无法直接应用于分子相似性比较问题,提出了基于索引文件的处理方法,将Hadoop云计算技术应用到分子相似性比较领域上。2)通过实验验证了该方法的可行性。实验结果表明该系统在拥有16个CPU并行处理的情况下,本方案平均比单机处理系统快14.4倍,有效地满足了分子相似性比较系统海量计算的需求。3)针对Hadoop的Partition算法可能存在的数据倾斜的问题,提出了一个均匀的轮询分区算法,减少了数据倾斜带来的影响,实验证明该算法可以使整个系统的效率提高5%以上。4) MapReduce框架具备容错功能,也就是当某个计算节点出现故障时,主节点会自动把该节点计算任务分配到别的空闲机器上,但是该计算节点的数据块会被从新处理。我们对此进行了改进,使得该数据块从新被处理时从上一次中断的地方开始,避免了大量的重复计算。
其他文献
时代是指以人类社会形态过渡界限为标准,所划分的社会历史发展的各个阶段。时代精神是指群体人概括反映特定时代的本质与现象的意识形态,时代的本质及其发展趋势乃是时代精神的
在社会生活中,青年始终是最积极、最有知识、最具有创造力的一部分。而青年就业困难的现状,也是目前不容回避的问题。本文对青年就业难的现状做了阐释后,具体分析了影响青年
面向多投影的显示系统在文化娱乐、医疗、军事仿真、会展行业和数字影院等诸多领域得到广泛应用。大规模球幕多投影显示系统因其大尺寸、宽视角、高分辨率和强沉浸感,给用户
诗味说和意境理论作为中国古代诗论的两大核心理论 ,两者有内在必然的联系。意境的情景要素使诗味这一描述性概念有了较为具体与可深化的审美内涵 ;意境的“抽象的界域”性使
心血管疾病严重威胁着人类健康,已经被世界卫生组织列为人类健康的头号杀手。心血管疾病发生的根本原因是动脉血管结构与功能的病变。很多心血管疾病患者因为没有及时发现动脉
喉气管狭窄是临床上较为常见的疾病,狭窄导致通气障碍、呼吸困难、患者需行气管切开、严重影响患者的社会交往及生存质量,给患者带来极大的身心痛苦。气管粘膜受损、坏死、缺损
超稠油油藏开发是世界性难题,河南油田利用热化学辅助蒸汽吞吐技术成功实现了超稠油油藏的高效开发。分析了氮气和降黏剂改善蒸汽吞吐效果的机理,通过室内实验方法评价优选降
反馈是读者为作者修改作文提供的信息,因此在写作教学过程中有着重要的作用。过程写作教学法区别传统的教学法主要体现在反馈的模式上。文章着重阐述了同伴反馈在过程写作教
近年来,随着社会提倡开发新能源,以及微机电系统(MEMS)的发展,对单晶硅片的切割质量、效率以及减少切割过程中产生的材料损失的要求越来越高。然而,由于硅材料的高脆性和高硬度,使得
“形象”作为一种无形资产和“软实力”在全球化的时代背景下已经越来越标识化和重要。国际形象、城市形象已经吸引了很多学者及相关部门的关注,并在理论和实践层面都取得了一