基于深度学习的蛋白质结构模型评估

来源 :吉林大学 | 被引量 : 0次 | 上传用户:ieuieuieu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质作为生命的承担者,在生物体内负责抗体免疫、激素调节和酶催化等一系列生理功能。构建精确的蛋白质结构模型评估方法作为蛋白质结构预测、结构优化、构象搜索等课题的核心任务而备受关注。精确的结构模型评估方法不仅对于蛋白质构象变化和功能阐述极其重要,同时还能够助力药物设计、疫苗研发、癌症治疗等精准医疗的实施。传统的蛋白质结构模型评估方法主要包括基于物理和势能函数的方法,以及近几年发展起来的基于机器学习和深度学习的方法。这些方法都各有优势,但也存在诸如计算精度无法满足需求、计算速度缓慢、缺乏物理学解释等缺点。鉴于此,本文基于广义溶剂化自由能理论和深度学习方法开发了一种评估蛋白质结构模型的近似自由能方法。从广义溶剂化自由能的角度,将相邻氨基酸定义为目标氨基酸的局部溶剂化环境,通过深度学习模型来学习局部环境和目标氨基酸类别间的关系,并借助贝叶斯推断近似得到广义溶剂化自由能。该方法的特点是兼具基于物理和势能方法的优点,即保证精度与速度的同时,还具有一定的物理意义。在前期研究中,我们发现相邻氨基酸间的角度信息比距离信息贡献更大,并且对角度进行cos和sin形式的转换,能提高目标氨基酸2%的类别预测准确率。针对类别预测概率较低的问题,我们还从结构尺寸大小、氨基酸类型等角度讨论,证明不同种类氨基酸的数目不均衡对其类别预测存在消极的影响。随后,尝试通过采样和扩大数据集的方式解决这一问题。并且还根据天然结构的分辨率和同源相似性,构建了不同冗余条件的数据集,以此研究数据集对氨基酸类别预测和评价分数的影响。最终,我们在考虑平衡结构数目和预测表现的情况下,选择Res3-Pc50数据集训练的神经网络来评估蛋白质结构模型。除此之外,我们还发现不同氨基酸间的结构相似性也是限制预测准确率提升的一个重要因素。在比较不同打分函数的性能方面,虽然我们的方法在诱饵构象标准集CASP5-8、CASP10-13、CASP14中均取得了最好的天然结构识别的表现,但仍然有部分天然结构无法被识别。经过分析,我们发现无法识别的结构与其质量和解析方法间存在联系,并为此使用核磁共振解析的蛋白质结构来重新训练神经网络,使得诱饵集内结构类型为NMR的天然结构的得分排名进一步提升。在诱饵模型鉴别方面,当诱饵模型有较高TM-score值(0.8~1)时,评价分数与TM-score有更大的皮尔森相关性系数。
其他文献
背景:世界范围内,乳腺癌的高发病率和死亡率严重危害着人们特别是女性的健康。由于引起乳腺癌发生发展的因素众多并且乳腺癌具有高度异质性,其有效预防和治疗也颇为复杂。人们按免疫表型将乳腺癌分为五种亚型,以便于乳腺癌治疗的科学决策。预防和较早发现乳腺癌的三种主要方式是筛查、化学预防和生物预防。乳腺癌分型有助于其针对性治疗,主要医治措施包括手术、化疗和药物靶向治疗等。90%与癌症相关的死亡都是由转移性疾病而
学位
非共价相互作用包括氢键、卤键、磷键、π···π堆积作用、CH···π作用以及tetrel bond等,其在化学、生物学等许多重要领域都占据主导地位。其中,CH···π作用是指CH键和π电子体系之间的非共价相互作用。Tetrel bond则是第IV主族原子与路易斯碱之间形成的一种非共价相互作用。截至目前,人们将研究焦点主要集中在了包含CH···π作用和tetrel bond作用的复合物的相互作用能大
学位
金属有机骨架(MOFs)是一类具有高比表面积、高孔隙率、活性位点丰富等特点的结晶微孔材料。而层状双氢氧化物(LDHs)是一类具有开放式层状结构的材料,具有层板金属阳离子同晶可替代性、层间阴离子可交换性等特性。MOFs@LDH复合材料能够保留MOFs高比表面积、高孔隙率的优点,形成的分层结构缩短了离子的扩散路径且增加了复合材料的面积,有利于提高复合材料的电化学性能。同时以泡沫镍作为生长基体能够避免粘
学位
糖尿病创伤由于愈合能力低下,常常会引发局部感染、溃疡和深层组织破坏,严重者甚至导致下肢截肢或死亡,每年给民众带来了沉重的健康和经济负担。这种慢性伤口难以愈合的主要原因有高血糖微环境导致的氧化应激损伤、细菌持续感染、炎症反应延长和细胞增殖与血管再生障碍,使正常组织创伤修复过程中的四个交叠阶段,包括凝血期、炎症期、增生期和重塑期均产生显著地影响和改变,给相关治疗策略提出了巨大挑战。目前,根据上述病变因
学位
锌锡氧化物(zinc tin oxide,简写为ZTO)是一类应用范围较为广泛的半导体材料。由于此类氧化物的化学性质比较稳定,而且带隙较宽,在可见光范围内具有较高的透光性。因此,在光电子器件、锂电池、薄膜太阳能电池以及染料敏化太阳能电池等方面都具有较广泛的应用。据文献报道,利用真空制膜技术,在常温条件下制备的ZTO薄膜通常为非晶体,通过高温热处理(高温退火)后,可实现非晶态向晶态的转变,例如,转变
学位
镍钴硫化物凭借丰富的价态、优异的电导率、对环境友好、成本低等优点,成为赝电容超级电容器电极材料最佳选择之一。由于镍钴硫化物在水热过程中容易出现团聚、断裂等现象,导致其导电性变差、电容性能不理想。因此,进一步改善镍钴硫化物的电容性能成为目前研究的重点,本文通过调控镍钴的比例、硫化温度等因素来合成镍钴硫化物,研究调控镍钴的比例、硫化温度对镍钴硫化物形貌和电容性能的影响规律及机理,并在此基础上与石墨烯(
学位
本文详细阐述了液压支架修理的3种方式以及维修过程中的各个生产环节流程,重点阐述了各个流程需要注意的事项。通过再制造技术使修复后的液压支架性能接近新制造产品性能。在支架大修改电液控制过程中,按照再制造技术标准组织生产,大大提高了液压支架修复后的质量,保障了井下使用可靠,保障了安全生产。
期刊
团簇作为连接微观世界与宏观世界的桥梁,其由数量不等的分子或是原子组成。团簇由于表面效应和量子限制效应,其表现出来的物理与化学性质与晶体迥然不同,而且其物理化学性质以及基态结构的构型与团簇的尺寸是紧密相关的。团簇领域的重要问题之一是团簇的生长模式的探索,然而对于小尺寸体系而言,我们可以通过第一性原理计算方法进行理论模拟,但是对于大尺寸体系,我们就显得束手无策了,这是一直困扰着科学家们的问题。硼元素由
学位
金属氧化物作为检测气体污染物的敏感材料由来已久。目前,以此所开发的电阻式气敏传感器中,人们对用于双气体检测的半导体敏感材料研究付出了大量的努力。寻找合适的敏感材料以实现对两种及多种气体的检测更加满足工业生产和日常生活的要求。丙酮与甲苯均是日常生活中常见的VOCs(挥发性有机物)气体,是室内VOCs污染物的主要组成部分。开发一种高灵敏性的传感器,及时准确的测定环境中的丙酮与甲苯的含量在工业生产、环境
学位
氢能作为一种高效的清洁能源一直受到人们的广泛关注,目前工业化生产氢的途径还是有很大的限制,综合来看电化学裂解水是目前最有效的产氢方法,在电化学裂解水过程中催化剂是重中之重,因此研发出高效且环保的电催化剂成为了亟需解决的核心问题。对于电化学析氢来说催化性能最好的依然是贵金属催化剂,而高昂的成本不利于大规模的商业化生产,所以现阶段急需一种可以替代贵金属电催化剂并且高效的新型催化剂。本论文从研究电催化析
学位