基于云平台的分子对接设计与实现

被引量 : 3次 | 上传用户:jcmmdq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分子对接技术是计算机辅助药物设计的主要方法之一,随着计算机技术、药物化学和分子生物学的发展,越来越多的小分子化合物和靶标蛋白在不断地被发现。人们在新药研发中的分子对接实验中将遭遇大规模数据计算与海量数据存储的双重挑战。计算机技术和互联网技术的蓬勃发展带来了云计算技术,云计算技术带来了强大的大数据处理能力。这种大数据处理技术为我们解决分子对接中的大规模数据计算与海量数据存储困难提供了新的思路和解决方法。自从Hadoop成为开源组织Apache的独立项目后,由于其高性能、低成本的优势,在有大数据处理需求的用户中得到了广泛使用。本论文通过对分子对接算法的分析,针对分子对接中的数据存储、査询和对接实现等关键问题,搭建了一个具有5个节点的Hadoop集群,并在基于Hive技术,构建了一个存储分子对接数据的云数据库,提供查询和分析功能。从用户查询需求角度出发建立元数据表,利用MapReduce计算框架对配体分子文件和对接结果文件进行解析,生成对应的数据文件存入云数据库。本文将以Hadoop和Hive技术为背景,对并行化的分子对接流程中的相关问题进行研究,主要工作如下:1.对分子对接算法进行理论分析,表明Autodock Vina实现分子对接原理和高效性,以及基于云平台处理分子对接问题的可行性;2.基于Hadoop搭建一个分布式集群用作实验平台,并基于Hive构建一个支持海量数据管理的云数据库,提供数据查询和分析功能;3.利用MapReduce框架实现并行分子对接功能,针对Hadoop调用第三方软件AutoDock Vina的关键问题,设计Map函数和Reduce函数,分别实现分子对接任务的分发和对接结果的汇总;4.利用MapReduce框架对分子对接结果进行处理,筛选出所有配体小分子及其相应的打分值存入到HDFS,并导入Hive数据库供用户查询、分析;5.通过对比单任务和基于云平台的分子对接两种方式来测试云平台对分子对接效率的提高,通过数据加载、字段组合查询、多表连接查询、排序查询等方法对分子对接结果进行测试。本文的研究工作可为云计算技术在分子对接研究领域提供示范。
其他文献
并购是上市公司实现其战略目标、扩大其规模的有效手段,而上市公司并购过程中往往存在盈余管理的倾向。本文在总结分析上市公司并购中主要的盈余管理方法及后果的基础上,提出
本文尝试着对符淮青先生关于词义和构成词的语素义关系的论述加以补正。符先生所说的“词义是语素义的引申比喻义”分别分成三种和四种类型。“部分语素在构词中失落原义”实
融资难一直困扰着工业小微企业发展。本文根据辽宁工业小微企业抽样调查数据,通过召开座谈会和走访相关部门等形式,观察小微企业融资情况,分析融资难原因,并结合辽宁工业小微
随着我国人民币国际化脚步的加快,跨境人民币结算业务应运而生,此项业务促进企业和银行双赢格局的实现。A银行虽然在市场上占领先地位,但随着该项业务的不断发展,该行面临的
《私人生活》使陈染成为一名以个人化写作为标志的女性作家。《私人生活》着重书写女性的精神之旅 ,体现了陈染的超性别意识 ,此外西方的文学、哲学对陈染有着深刻的影响。这
一般地,企业工资薪金发放可以采取年薪制、年终奖和股票期权等,并代扣代缴个人所得税。如果企业太少关注其中的节税技巧,会使员工多缴纳个人所得税,造成"多劳而不多得",进而
电子商务B2B支付系统是企业对企业间的电子支付形式。B2B支付系统主要用于解决批发类大宗交易的网上支付问题。随着互联网的普及和电子商务的快速发展,传统的实体市场和行业
在企业的运作中,新产品开发是一项具有重要战略意义的活动。项目管理方法是当今得到公认的优秀管理方法。本论文通过运用项目管理方法对HC公司新产品开发项目管理的研究,对于
莫言是我国当代著名作家,在2012年获得诺贝尔文学奖,他是中国第一位获此殊荣的作家。莫言的小说充满怪诞特征,他小说的怪诞与残雪和马尔克斯小说的怪诞虽有相同,但更多的是不
随着经济的发展,我国社会物质生活水平得到了不断地提高,当今,人们对建筑物的功能性、舒适性和安全性有了更加广泛的关注,需要建筑行业对此有切实的回应,以便在满足人们各种