GM-Pep:从头设计功能性肽序列的高效策略

来源 :兰州大学 | 被引量 : 0次 | 上传用户:carlos_yu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以胰岛素为代表的内源性多肽物质具有高效,低毒的特点,在过去的近百年时间中,药物学家非常重视多肽治疗药物的开发。尽管有一大批多肽化合物在不同的时间段进入了临床前和临床药物研究阶段,但只有很少一部分经过化学修饰或合理设计的多肽作为临床用药能获批上市,而其它大多数都因其意外的副作用或存在安全性问题而失败。幸运的是,人工智能等计算机虚拟技术已被用于预测多肽的活性、毒性和ADME性质(吸收、分布、代谢及排泄),这样可以有效加速多肽治疗药物的发现。通常,多肽的特定生物活性可以通过以兴趣为导向的二分类器来准确判定,一般情况下,该方法使用一个阳性样本集合和另一个通常未经实验验证的阴性样本集合来构建。这种方法在药物研发(R&D)的早期阶段要实现对研究对象的精确综合性评价具有极大的挑战性。本文以设计生成具有单一特定抗细菌、抗真菌或抗高血压活性并能有效规避毒性的多肽化合物为例,探究人工智能在多肽从头设计中的应用,主要的实验内容为:通过深度学习的方法建立生成模型得到毒性低的具有单一生物学功能的多肽化合物,从头设计以得到结构新颖的治疗性多肽序列为目的,随着人工智能技术在药物设计方面日益成熟,两者的有效结合在理论和实际上都具有缩短药物研发周期的能力。相比于传统机器学习的方法,深度学习在生成模型上更具有显著的优势,具体表现为:在特征提取方面,深度学习模型需要的人工干预更少;在数据容量方面,深度学习更擅长找到数据样本之间的潜在联系。基于此考虑,本文使用独热编码特征提取算法(one hot encoding)和条件变分自编码模型(CVAE)来生成高潜力活性的抗细菌多肽、抗真菌多肽和抗高血压多肽序列,之后利用主成分分析技术(PCA)对生成肽的序列和模型训练使用的多肽序列从两个主要维度上进行成分可视化操作。结果表明两者的主要成分在空间上高度重叠,这在一定程度上证明生成的序列与训练的序列具有相似性。我们还通过modl AMP库和双侧魏尔希t检验分析比较了生成的肽序列、训练使用的肽序列和来源于随机生成的肽序列三者之间的物理化学性质的差异性,进一步验证了生成序列的可靠性。最后,我们还用现存的最先进的预测平台检测了生成的序列的毒性效用比,结果显示绝大多数的生成序列具有理想的治疗性能。深度多分类器预测其毒性或效用,在对目标序列实施生物实验验证前,人工智能的方法是从大量具有潜在生物活性的序列中挑选出高效和低毒性的候选序列。虽然研究者们开发出了大量的二分类器,但是这些二分类器需要使用没有经过实验室验证的样本作为阴性对照来使用。为了解决此问题,本文选择使用经过实验验证的抗细菌多肽、抗真菌多肽、抗高血压多肽序列和毒性肽数据,通过设置过滤步骤,得到符合要求的活性肽数据集。由上述处理得到的数据采用最简单的序列特征表示(SR)提取算法,经训练和测试后构建了一个深度学习预测器以及8个传统机器学习预测器。最终结果显示Only-Bi LSTM深度学习模型在ACC和MCC上均优于其他8个传统机器学习预测器,在此基础上,通过手动调节超参数等手段进一步开发出模型性能更好的Deep-Multiclassifier。由上述的生成模型与Deep-Multiclassifier共同组成了基于深度学习的从头设计的方法:GM-Pep。
其他文献
在OLED(Organic Light-Emitting Diode)快速发展的时代,因为有机发光材料拥有种类繁多,可调性好,色彩丰富,分子设计相对比较灵活等多种优点,对于有机发光材料的研究越来越受到人们的高度重视。功能化分子修饰香豆素作为有机小分子发光材料,其荧光效率高,易于合成,稳定性好等特点被广泛关注。在香豆素骨架的3-位和7-位进行修饰,从而使化合物光电性质发生变化,使它们能广泛应用于光学
学位
发展新能源汽车已成为国家战略,NdFeB磁体是电动汽车驱动电机关键材料,但高速、重载等苛刻工况发热易使磁体不可逆退磁,导致电机性能劣化。添加高含量重稀土可有效提高NdFeB磁体性能,但会大量消耗重稀土资源且磁材成本大幅上升,所以如何降低重稀土用量已成为国内外研发的热点和重点,而重稀土晶界扩散工艺可以有效改善NdFeB磁体的热稳定性,大幅提升磁体矫顽力,同时减少重稀土用量,节约资源。因此,本文采用磁
学位
有机发光二极管是新一代的显示技术,相比于传统的液晶等显示技术而言,有着更强的竞争能力。在有机发光二极管中,发光层扮演着至关重要的角色,不断有新理论和新工艺被开发出来改善器件的性能。因此,开发出新型高效的发光材料是有机发光二极管研究领域中的重要方向。本文介绍了一系列咔唑/咪唑功能化的2-(2′-苯酚)苯并噻唑(BTZ)配体及其二氟硼配合物的合成和发光性质,并将其作为发光材料应用到电致发光器件中。具体
学位
太阳能具有储量巨大、清洁环保的特点,高效的开发利用太阳能对解决能源危机具有重要意义。作为光热转化利用系统的重要组件,光热转换涂层性能的优劣直接决定整个系统的光热转换效率。因此,开发工艺简单、具有成本优势的高性能光热转换涂层,是光热转化利用技术领域中十分重要的研究课题。本文基于Me-MeNx和Me-MeOx(Me=Al或W)基光热转换吸收涂层光谱选择性易调控、结构扩展性好的特征,开展了Me-MeNx
学位
在当前的大数据时代下,互联网中文本数据规模庞大使得文本挖掘工具被越来越多的使用。主题模型作为一项重要的文本挖掘技术,在实践中常依赖于近似推理方法,包括以马尔可夫链蒙特卡罗为代表的随机性近似和以变分推理为代表的确定性近似方法。本文聚焦于近似推理算法,建立高斯混合模型对比了多种近似推理算法的多项性能,实现了基于融合算法的文本主题推理,并对算法与模型进行优化与可视化分析。综述了在变分推理领域近年来的国内
学位
铁路作为重要的基础设施,是交通运输的大动脉。随着电气化铁路的高速发展,接触网线路安全稳定运行的要求也随之提高。在列车运行过程中,侵入接触网线路的异物、接触网支架上的鸟巢如果不及时处理会引发严重的交通事故。目前采用人工巡检的方法进行接触网异物检测,存在成本高、效率低等缺点。为了提高检测性能,本文提出基于深度学习的接触网异物目标检测方法。主要内容如下:(1)阐述了图像处理相关的理论基础,通过对传统目标
学位
当前,随着人工智能领域在人类生产生活范围内的广泛应用,人们对人工智能产品的需求性、依赖性不断提高。在这种背景下,基于智能化的无人驾驶技术也得到了飞速的发展。研发使无人驾驶汽车更高效、更精准的感知道路环境的目标检测技术,已经成为无人驾驶领域的重中之重。在对道路场景的障碍物的目标检测中,将目标检测数据运用于深度学习网络是当前最普遍的方式,深度学习网络拥有良好的拟合能力和鲁棒性,点云数据拥有更加全面的深
学位
随着全电子计算机联锁的出现,铁路信号进入新的发展阶段。同时,对联锁系统的可靠性和安全性有了更高要求。根据实际运用中存在的问题,利用最新技术对全电子计算机联锁系统进行完善和改进成为铁路信号的重要课题。全电子执行单元作为计算机联锁系统中的执行部件,完成对现场设备的控制和信息采集。执行单元中的通信部分大多数是基于控制器区域网总线(Controller Area Network,CAN)的双机热备或二乘二
学位
目的:本研究探讨石蒜碱对K562细胞及伊马替尼耐药K562细胞增殖、凋亡、自噬的影响,并从自噬层面初步阐述石蒜碱逆转伊马替尼耐药慢性白血病可能的分子机制,为临床逆转慢性髓性白血病靶向药物的耐药问题提供新的思路。方法:采用梯度诱导法建立伊马替尼耐药细胞株(K562/IM),CCK-8法检测K562细胞及K562/IM细胞对伊马替尼的敏感性及细胞形态学变化;利用生物信息学分析K562细胞与K562/I
学位
车联网是物联网在汽车产业的一个重要分支,它为汽车产业发展提供了新动能,通过借助信息科学技术,可以提升车辆的智能驾驶水平,减少了交通拥堵的概率。定位技术作为其中较为关键的基础技术之一,也受到了广泛的关注与重视,同时各国学者也逐渐加快了对其的研究步伐。随着国家对信息通信行业的重视,基站普及率将逐步升高,无线定位技术必将大有可为。但是在无线电定位过程中主要存在着两大问题,一方面是对于定位目标位置的求解所
学位