面向药物发现的抗病毒药物资源库与筛选平台的构建

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ysli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新出现和已存在的病毒是人类和动物中各种感染疾病的主要病原体,会导致各种高死亡率流行病和大流行病的发生。一个典型的例子就是2019年12月31日爆发的COVID-19疫情,它是由一种称为严重急性呼吸综合征冠状病毒2(SARS-Co V-2)的新型冠状病毒株引起的一场急性呼吸系统疾病大流行。由于缺乏有效的抗病毒药物,COVID-19不断危及全球公共卫生。对于大多数病毒,如丙型肝炎病毒(HCV)、流感病毒(INFV)、严重急性呼吸系统综合症冠状病毒(SARS-Co V)、单纯疱疹病毒(HSV)等,有效的抗病毒药物也是有限的。因此,迫切需要加快药物发现过程。随着计算机技术的不断发展,利用机器学习技术可以在很大程度上帮助发现和设计抑制病毒或者消灭病毒的候选药物,以及识别新的药物靶点和确定已知药物的优先级。但是这一切的前提是大量且可用的高质量数据和高精度的算法。目前,鉴于各类病毒的周期性出现和人类对病毒认识的逐渐深入,病毒的生物学、结构、化学和药理学等数据也在迅速增长,对这些数据的深度加工和利用,将会在很大程度上指导抗病毒药物的设计与开发。基于抗病毒数据统一收集和整理的需求以及机器学习在抗病毒药物发现中的应用,我们提出并开发了一个基于Web的可开放获取的抗病毒药物资源库与筛选平台(VDDB),以提供专用的、经实验验证的抗病毒药物和潜在靶标信息以及抗病毒药物筛选模型。目前,针对39种易引起临床感染疾病的重要病毒,VDDB储存和展示了共计约715577种经实验验证的潜在药物,包括848种临床试验疫苗和199种临床试验抗体,以及714530种潜在的小分子化合物。此外,我们的数据库资源存储了大约300多万条药理数据,其中涉及314种细胞表型评估和234种靶标评估。基于这些多层面注释的药理学数据,用户可以通过文本挖掘或基于相似度的分子搜索,来获得各种病毒药物的可靠信息。针对上述收集的大量的抗病毒研究数据,我们采用六种机器学习方法,如SVM、XGBoost、DNN、GCN、GAT、FP-GNN,构建了57种基于表型细胞和117种基于靶标的抗病毒分子活性预测模型。评估结果表明,基于XGBoost的细胞表型筛选模型取得了最优结果,其测试集的平均F1值为0.877±0.133,平均BA值为0.752±0.191。在靶标预测模型结果方面,XGBoost方法的平均F1值为0.862±0.145,平均BA值为0.620±0.109。这些建模结果表明我们构建的预测模型可以实现对抗病毒分子活性的精准预测。我们把已建立的模型集成到VDDB平台中,以供领域内的研究者免费使用,可以用于虚拟筛选、靶标钓取以及药物重定向等研究。我们期望VDDB可以作为一个一站式的、致力于促进和加速抗病毒药物发现的知识库。VDDB可以通过https://vddb.idruglab.cn免费访问。
其他文献
ε-己内酯是一种有机化工中间体,可作为单体合成聚己内酯。由于聚己内酯具有良好的生物降解性能、生物相容性、热塑性和成型加工性,其在生物医学工程、环保和材料等领域有广泛的应用。目前工业上主要采用过氧酸氧化法合成ε-己内酯,过程繁琐易爆、能耗物耗高且环境污染大。近年来,生物酶法合成ε-己内酯被认为是一种更具竞争力的绿色替代方法。在醇脱氢酶(alcohol dehydrogenase,ADH)和环己酮单加
学位
液-液相分离(LLPS)是一种普遍的生物学现象,越来越多的证据表明,LLPS是细胞中无膜隔室形成的基础。p53是一种转录因子,可以通过调节不同靶基因转录参与多种细胞生命活动,如细胞凋亡、DNA修复和细胞周期控制。翻译后修饰,如磷酸化在其功能的调节中起重要作用。在细胞中,p53已被发现参与Cajal、DNA修复隔室、早幼粒细胞白血病蛋白体等细胞液滴。本课题通过高分辨成像等技术研究p53相分离及磷酸化
学位
创新创业是促进经济快速发展的重要源动力,而创业者创业的勇气多数源于机会信心,当创业者发现创业机会,对自身能力、知识和资源等进行合理分析和判断,通过学习创业所需的知识、信息和经验等以弥补自身不足,促进创业自我效能的提高,使得创业者对所识别的机会形成可行性信心,有助于创业者更有勇气创业,促进创业活动。创业者的机会信心作为在创业过程中行动和抉择的重要支撑,是创业研究领域的关键。在创业前期,由于创业者自身
学位
酱醪中微生物与生酱油理化性质互相影响,紧密联系。本研究以一种传统酱油盐水发酵过程为研究对象,通过测定发酵过程中酱醪理化性质、风味物质以及鉴定微生物群落,探究生酱油的品质变化特点及发酵规律,并通过关联分析明确酱醪中重要的微生物。结合高效液相色谱和气质联用等多种方法,对不同时期的酱醪进行理化指标及风味物质含量的测定。结果发现这种盐水发酵方式中头油品质最好,含1.5 g/100g总氮、1.0g/100m
学位
随着中国经济的发展,我们早已进入消费升级时代和VUCA时代。市场的不稳定性和技术的快速变革使得企业不得不选择“抱团取暖”,主动加入或构建生态系统。市场竞争也早已由单个企业间的竞争扩散为整个创业生态系统之间的竞争。越来越多的企业意识到了生态系统和共生战略的力量,试图运用共生战略形成和谐、稳定、互补的共生关系,以利用整个生态系统的力量去应对环境变化所带来的持续的不确定性和无法判断的未来。理论方面,创业
学位
罗汉果是具有岭南地区特色并被国家首批批准列入药食两用材料的食源性药材,葫芦烷三萜苷类化合物即罗汉果苷,是罗汉果提取物的主要及有效生理活性成分,但直接摄入的多配基皂苷结构却难以被人体消化系统直接代谢吸收,因此,编码有数千种糖苷水解酶的肠道菌群,在协助宿主代谢从而影响多糖结构物质的益生活性、口服生物利用度等方面起着极其重要的作用。肠道微生物水解去除皂苷的部分或全部糖配基可得到更容易被人体利用的小分子物
学位
米曲霉、黑曲霉是目前工业上常用的曲霉属真菌菌株,且因为其悠久的驯服历史及较高的食品安全性,在我国广泛应用于食品酿造行业。目前常用育种方法为传统的诱变及原生质体融合方法,具有不确定性和盲目性,且需大规模的筛选工作。Cas9-sg RNA核糖核蛋白(ribonucleoprotein complexes,RNP)复合物的转化属于DNA-free的方式,脱离了传统的转基因的范畴,且降低了脱靶作用,可以达
学位
加快科技创新是推动经济高质量发展的需要。国有企业作为我国国家创新体系的关键组成部分,其创新能力对国家整体创新能力具有重要影响。经过40多年的改革,我国国有企业的活力明显增强,但由于委托代理冲突导致其仍存在创新动能不足、效率较低等问题。因此,发展混合所有制经济成为新时代国企改革的关键突破口。已有研究从所有权结构、董事会治理和高管治理等视角出发对混改国企创新的影响因素进行了大量实证检验。其中,董事会作
学位
本论文聚焦于烘焙食品工业废水碳氮比高等问题,以放射状软性填料结合无纺布、毛圈状软性填料结合无纺布、单一无纺布为填料,分别应用于折叠曝气生物膜反应器中,设立三个反应器,处理此类高碳氮比废水。三个反应器在启动前期已成功挂膜,对污染物表现出良好的去除效果,在稳定运行阶段,所有反应器对COD和氨氮的去除效率都在98%以上,并且没有NO3--N和NO2--N积累,在进水7h内可以实现污染物的完全去除,即反应
学位
在当今新经济时代下,科技创新是国家高质量发展的重要引擎。自二十一世纪初,国家实施了两轮东北老工业基地振兴战略,初显成效。但由于吉林省企业仍创新意识不足、市场敏感度低,长期处于创新效率低下状态,加之市场环境变幻莫测,吉林省的经济下行压力依然较大。根据近几年的统计年鉴显示,同我国发达省域相比,吉林省在创新投入、创新产出和创新转化三方面存在较大差距。随着数字经济蓬勃发展、新冠肺炎疫情的蔓延,吉林省人口红
学位