2D和3D分子相似度虚拟筛选方法的互补性探索研究及其应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:looen01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物发现过程往往需要一个漫长的时间周期,在大量的天然产物及合成化合物中寻找大批量的药物机率非常微小,是一项耗资巨大且具有高风险的活动。随着硬件发展与学科技术的不断更新,更多的化合物结构被解析。研究者总结出化合物成药性的规律,并根据化合物结构或化学特征通过计算机对百万级甚至千万级的化合物数据集进行高通量筛选或者虚拟筛选。目前,计算机辅助药物设计因其低成本、高效、可定制等特征,正逐渐成为药物发现的重要工具之一。其中,基于配体的虚拟筛选方法因不需要解析靶标的晶体结构而成为先导化合物发现阶段的主流技术手段,主要包括基于2D分子指纹(基于结构片段信息)和3D特征(形状、静电势、药效团等)的相似度计算。基于2D分子指纹的虚拟筛选工具利用化合物之间的二元结构片段信息,具有速度快、命中率高等特征,但是受限于预定义的片段结构,在筛选过程中较难发现新颖的骨架。基于3D分子形状(静电势和药效团)的虚拟筛选工具相对来说计算过程需要花更多的时间,且准确性一般低于2D指纹方法,但是不会被片段所局限,发现的活性化合物中往往具有新颖的骨架。2D和3D分子相似度虚拟筛选方法的优缺点就像太极图的两个半圆,其内核(原理)基于分子的二维和三维的两类特征,将其进行杂交融合是否能得到一个圆满的“圆”呢?在课题组分子杂交相似度计算方法的研究基础上,本文进一步系统地探索了2D和3D分子相似度虚拟筛选方法互补性存在的一般性规律。为此,本文选取DUD-E(102个靶标)和LIT-PCBA(15个靶标)两个基准数据集,对15种3D相似度虚拟筛选方法和11种2D相似度虚拟筛选方法进行系统的虚拟筛选效能评估,评估指标包括(1)虚拟筛选准确度指数,如ROC曲线下方的面积大小(Area Under Curve,AUC),富集因子(Enrich Factor,EF),命中率(Hit Rate,HR);(2)骨架跃迁能力(scaffold hopping),如骨架个数分析和骨架整体相似度分析;(3)互补性分析,如模板互补性分析和方法互补性分析。最后,采用预定义的打分函数,对11种2D打分方法和9种3D打分方法进行融合打分,并比较杂交相似度方法(Hybrid Sim)和纯2D和纯3D方法的虚拟筛选效能。研究结果表明(1)在15个3D相似度虚拟筛选方法中,SHAFTS,LS-align,Phase Shape_Pharm和LIGSIFT表现出较好的虚拟筛选准确度,也显示出较好的骨架跃迁能力;(2)相比3D相似度方法,绝大多数2D相似度方法显示出更好虚拟筛选准确度;(3)相比单纯的2D和3D相似度虚拟筛选方法,通过预定义打分函数获得的杂交分子相似度方法(Hybrid Sim)能有效提高虚拟筛选性能。基于最优的杂交相似度组合方法,开发了在线虚拟筛选平台。该平台集成了预处理过的化合物数据库和最优的4种3D分子相似度方法和2种最佳组合搭配的2D方法,将有助于药物发现。
其他文献
国际贸易在国民经济发展中发挥着越来越重要的作用,跨境电商已经在我国的跨境贸易中占据越来越大的比重,对于跨境电商人才的培训也越来越引起国家相关部门的重视。国家出台了一系列政策扶持跨境电商专业人才的培养,但人才信息庞大而冗余,存在着严重的信息过载问题,推荐系统能够对这些信息进行有效的筛选。本文主要是对以下两方面进行研究并开展工作:(1)基于传统关键词提取算法Text Rank,利用共现词以及文本互信息
学位
学位
学位
学位
学位
学位
学位
学位
随着社会的发展,人类产生的数据量日益增加,存储系统在容量和性能等方面的挑战也在日益增加。传统存储系统采用DRAM缓存数据,由于DRAM的易失性,掉电后数据丢失,使得传统存储系统无法满足当前社会需求。而新型存储器STTMRAM属于非易失性存储器,同时具有与DRAM相媲美的读写速度和无限的耐擦写等优点,使其成为替代DRAM候选者之一。基于其更优越的特性,本文采用新型存储器STT-MRAM来替代DRAM