ABCG2蛋白转运分子识别的机器学习模型——基于蛋白质残基相互作用网络描述符

来源 :兰州大学 | 被引量 : 0次 | 上传用户:hellen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
ABCG2蛋白作为胎盘中的主要外排蛋白之一,负责将外源性物质从胎盘中排出而减少外源性物质的胎儿暴露,因此具有保护胎儿的功能。研究表明,妊娠期间经胎盘转移的环境化合物可能与胎儿的不良健康影响和出生结局密切相关。因此ABCG2蛋白与外源性环境化合物的相互作用以及对化合物的转运机制研究对于进一步评价环境化合物的胎盘暴露风险具有重要意义。本论文采用分子对接(Molecular docking)、分子动力学(Molecular dynamics,MD)、残基相互作用网络(Residue interaction network,RIN)、定量构效关系(Quantitative structure-activity relationship,QSAR)和警示子结构(Structural alerts,SAs)分析等计算生物学方法,对ABCG2蛋白与1100种化合物的结合模式和转运机制进行了系统地研究,构建了ABCG2蛋白转运分子识别的分类预测模型,主要工作内容包括:结合分子对接与分子动力学方法,对ABCG2蛋白与1100种化合物的相互作用和结合模式进行了分析;同时基于ABCG2-化合物复合物结构进行了基于残基距离的残基相互作用网络(RIN)构建以及网络拓扑性质分析。研究结果表明不同结构化合物与ABCG2结合后会导致ABCG2蛋白构象发生不同的改变,这种变化不仅体现在单个氨基酸残基的构象变化,还会导致蛋白的残基相互作用网络发生明显改变。残基相互作用网络作为蛋白结构的特殊表征方式,能够有效捕捉蛋白质构象的关键特征,并通过残基相互作用网络中残基节点网络性质对构象之间的差异进行量化分析。因此,通过构建ABCG2结合化合物后的复合物对应的残基相互作用网络,结合网络中残基节点性质获得RIN网络描述符(RIN descriptors,RINDes),可以实现对ABCG2蛋白转运化合物的有效识别。选择支持向量机(Support vector machine,SVM)、随机森林(Random forest,RF)、k-最近邻(K-nearest neighbor,KNN)以及逻辑回归分类(Logistic regression,LR)四种机器学习算法,基于化合物一般描述符(General descriptors,Gen Des)、受体-配体相互作用描述符(Receptor-ligand interaction descriptors,Rec Lig Des)以及RIN网络描述符(RIN descriptors,RINDes),我们开发了一系列的QSAR模型用于识别并分类ABCG2可转运化合物和不可转运化合物。结果显示,RIN网络描述符较其他描述符在分类建模过程中展现出了明显的优势,使用RIN网络描述符构建的随机森林模型具有最优的预测性能。在包含1100种化合物的数据集中,训练集十折交叉验证的准确率(Accuracy)为0.97,精确率(Precision)为0.98,召回率(Recall)为0.96,ROC曲线下面积(Area under receiver operating characteristic curve,AUC)为0.94;测试集预测准确率为0.96。对包含1100种化合物的数据集根据其ABCG2转运活性进行警示子结构提取并分析。结果显示含有蝶啶、甲基喹啉、嘧啶、苯环及其衍生物等芳香环结构的化合物更可能被ABCG2转运。综上所述,残基相互作用网络的构建为配体介导的蛋白构象差异分析以及蛋白构象的量化表征提供了新思路,为转运蛋白分子识别的预测模型建立提供了新方法,为进一步研究环境化合物的胎盘转移机制以及胎儿暴露风险提供了理论依据。
其他文献
土壤安全是国家发展的重要基础。我国正处于实现“双碳”目标的重要阶段,土壤修复作为环境保护战略的重要组成部分,其碳排放势必会对“双碳”目标产生重要影响。重金属污染是土壤无机污染中最突出的污染问题,对土壤肥力、粮食产量、人体健康和生态环境已造成严重影响。化学钝化修复技术因其在修复过程中碳排放量较少,成本低,不影响土壤正常使用等特点,成为修复重金属污染土壤最经济有效的技术之一。坡缕石作为一种黏土矿物,储
学位
本课题采用离子交换法处理含铜酸性矿山废水,以5~25mg/L含Cu(Ⅱ)水样作为研究对象,以Cu(Ⅱ)的去除率和吸附量作为评价指标,选取D463型离子交换树脂为吸附剂,研究了外部因素对D463型离子交换树脂除Cu(Ⅱ)性能的影响,同时探讨了树脂的再生性能及吸附除铜机理。在此基础上,利用L-半胱氨酸和3-氨基苯硫酚两种不同的改性剂对其改性处理,通过单因素试验、正交试验以及响应曲面试验等方法逐步优化改
学位
在石油资源开发、生产、运输和流通等环节,石油污染物通过各种方式进入生态环境,其中地下水石油污染是石油污染物对水环境产生的主要污染之一。二十世纪末以来,环境科学领域开始出现针对地下水石油污染的研究,相关研究结果显示地下水石油污染易随地下水流动扩散,并通过水循环进入生物体内,严重影响生态环境安全。因此,研究修复地下水石油污染具有重要现实意义。地下水石油污染具有分布广、易迁移的特点,其治理难度高、对环境
学位
分子印迹电化学传感器在应用于复杂样品检测时展现了出色的分析效率,尤其是在疾病标志物及中药活性成分检测等领域大放异彩。抑郁症是一种发病率高,危害性大的精神疾病,临床缺乏客观诊断的方法,漏诊误诊时有发生。精氨酸琥珀酸合成酶1(ASS1)是尿液中的抑郁症标志物,实现其高灵敏、高选择的检测或对抑郁症的无创客观诊断提供帮助。松果菊苷是存在于多种药材中具有丰富药理活性的化学成分,开发可用于复杂样本(如血浆、药
学位
抗生素由于其广泛使用以及难自然降解成为一种新兴污染物,长期富集后促使生物体产生抗生素抗性基因,从而对生态系统造成很大危害。Ag@Ag X纳米粒子由于金属Ag的SPR效应具有很强且有效的吸收可见光的能力,并可通过光活化的方式增强并稳定光催化活性,制备的光催化剂对抗生素和有机染料等污染物都表现出良好的降解效果。凹凸棒土由于其独特的结构广泛用于吸附剂、粘结剂和催化剂载体等,较好的吸附性能有利于提高光催化
学位
高效液相色谱分离分析的核心为色谱固定相,而整体柱作为一种新型的色谱固定相,因其通透性好、传质快、能耐受较广的p H等优点被广泛研究。相较于毛细管整体柱制备过程复杂、重现性差的缺点,常规尺寸整体柱因制备过程简单、重复性好以及应用更加广泛的优点而更值得研究。并且和超高液相色谱相比,高效液相色谱和常规尺寸整体柱结合后,能在较高流速下快速分析化合物的同时还能拥有较低的柱压,不仅降低了分析的成本,还减小了对
学位
随着居民生活质量的提高,城镇生活污水排放量日益增多,增加了氮、磷污染物的排放。与此同时,污水的C/N比却呈现下降趋势,提高了污水处理的难度。因此,去除低C/N废水中的氮、磷营养物质成为近年来废水处理中亟需解决的问题。而传统生物工艺流程复杂,存在脱氮除磷效率低,耗能大,剩余污泥量大,且需要额外添加碱度、碳源以及絮凝剂等诸多问题。因此需要开发新型的脱氮除磷工艺。课题组前期研究发现的生物海绵铁体系(Bi
学位
厌氧氨氧化具有广阔的应用前景,但是启动时间长以及脱氮不彻底限制了其在实际污水处理方面的推广应用。针对厌氧氨氧化工艺在实际应用中的存在的问题,国内外学者已经研究出了一些强化途径,投加适量的铁、投加低浓度有机碳源或者调控设置合适的氮负荷这三种方法都已经被证实对厌氧氨氧化有强化作用。但关于这三种方法的研究大多集中在启动成功的厌氧氨氧化反应器中,未见这三种强化方法在厌氧氨氧化反应启动过程中的系统研究,而且
学位
在人类社会进展过程中,自然资源被过度开发,导致环境污染与能源短缺问题日益凸显,因此人们使用物理、化学和生物等方法来解决这些问题,但这些方法可能对环境造成二次污染。为此众多专家学者研究发现光催化技术是解决环境与能源问题的有效途径之一。光催化技术的核心是光催化剂,因此,光催化技术研究的重点之一在于研发高效且稳定的光催化材料。在目前已知的各种光催化材料中,硫化镉(CdS)具有相对较窄的禁带宽度以及较好的
学位
目的:脑胶质瘤是最常见的原发性脑肿瘤之一,约占中枢神经系统原发性肿瘤30%左右,占中枢神经系统原发性恶性肿瘤的80%,胶质瘤也是人类最致命的癌症之一,患者预后差,治疗困难。恶性程度最高的胶质母细胞瘤(GBM),尽管目前有积极的手术、放疗和化疗,其中位生存期充其量也只有12至15个月,因此在大多数情况下,这种恶性肿瘤患者并不能从这种包括症状控制和肿瘤细胞减少的治疗中获益。最近,对癌症发病机制的深入了
学位