基于深度学习方法的蛋白质泛素化位点预测方法研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户：lidenglu1114

【摘要】

：

【作者】

：

刘大鹏

【机构】

：

东北师范大学

【出处】

：

东北师范大学

【发表日期】

：

2021年01期

【关键词】

：

泛素化位点预测深度学习半监督学习生成对抗网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

蛋白质泛素化修饰在细胞信号转导、细胞周期调控、DNA损伤应答和细胞免疫应答等众多生命过程中发挥关键调控作用。研究人员在多种遗传性的退行性疾病中发现了蛋白质泛素化修饰的改变,说明其与相关疾病的发生密切相关,揭示其调控机制对这些疾病的诊疗以及相关药物开发都具有重要意义。通过生物实验已经识别出了大量泛素化蛋白及其修饰位点,然而,生物实验难以进行快速大规模的位点识别。因此,生物信息学方法被引入到该研究领域。但是,目前的预测算法普遍存在所用序列特征偏少、分类算法陈旧、负样本不可靠、正负样本数据量不平衡等问题,这在一定程度上影响了预测性能的提升。同时,数据的大量积累使得深度学习方法在该问题上能够有效应用,但是基于深度学习方法的预测程序还很少,很多性能优异的深度模型尚未被应用。针对上述问题,本文在对蛋白质序列进行多种特征提取的基础上提出了一个应用深度学习技术预测蛋白质泛素化修饰的算法。首先对蛋白质序列提取8种序列特征和5种结构特征,并对提取到的原始特征向量通过特征选择进行降维。然后,提出了一个基于半监督深度学习方法的蛋白质泛素化位点预测框架。该框架分为三个处理阶段。首先,通过一种基于半监督生成对抗网络模型的异常点检测算法GANomaly从无标记样本中构建可靠负样本集,以此提高负样本的可靠性。然后,通过一个生成对抗网络模型不断生成新的正样本从而实现对正样本集的扩增,改善训练集不平衡问题。最后,通过训练一个包含多个卷积层和全连接层的深度神经网络分类器对蛋白质泛素化修饰位点进行分类识别。最后,我们通过实验对算法性能进行了测试。首先,从不同物种中收集泛素化蛋白及修饰位点数据组成了4组不同规模和物种构成的数据集。然后,在训练集上进行了10倍交叉检验,结果表明,本算法在预测性能上优于现有算法。接下来,在独立测试集上进行了测试,结果表明,本算法预测性能得到了提升,同时,不可靠的测试集在一定程度上影响了性能提升幅度。最后,通过实验分析了算法中各种策略对预测性能提升的有效性,结果表明,提取可靠负样本集和扩增正样本集都对性能的提升具有促进作用,这两种策略联合使用的促进作用更大。

其他文献

“结束隔离竟不舍得离开……”

报纸

卫生间医学观察防疫人员

新的征程上要继续发挥自我革命这个独特优势

勇于自我革命是中国共产党区别于其他政党的显著标志。党的事业推进的历史和自身发展壮大的历史,就是一部自我革命史。中国共产党之所以能不断地进行自我革命,关键就在于有批评和自我批评这个马克思列宁主义的武器。党的十八大以来,以习近平同志为核心的党中央坚定不移推进全面从严治党,以刀刃向内的政治勇气向党内顽瘴痼疾开刀,深入推进反腐败斗争,体现了中国共产党自我革命的决心与意志。

期刊

自我革命批评和自我批评反腐败斗争

破立并举弘扬新风正气

报纸

政治规矩机关作风建设满意度

以作风建设为抓手不断推进全面从严治党

报纸

全面从严治党机关作风建设

二维空间带指数非线性项薛定谔方程的正规化解

Schrodinger方程是量子力学中的基本模型,在Bose-Einstein凝聚等问题中有着重要的作用,对Schrodinger方程的正规化解的研究近年来引起人们的极大关注.本文主要应用变分法来寻找下述Schrodinger方程的正规化解其中正规化条件ρ>0是给定的,Lagrange乘子λ ∈R是未知的.结合Ekeland变分原理,Trudinger-Moser不等式和Nehari-Poh

学位

正规化解Schrodinger方程指数非线性项Trudinger-Moser不等式变分法

(预-)马尔切夫代数上的O-（对偶-）N结构

设M是特征为0的代数闭域F上的有限维马尔切夫代数.本文主要研究了带有表示V的M上的O-(对偶-)N结构.我们主要证明了:O-(对偶-)N结构可以产生一对相容的O-算子.作为一个应用,我们得到,一个可逆的反对称r-矩阵可以通过r-N结构生成与之相容的r-矩阵,与此同时,我们在4维马尔切夫代数上给出了与上述结论对应的例子.最后,我们在预马尔切夫代数上得到了一些类似的结果.

学位

马尔切夫代数预马尔切夫代数O-（对偶-）N结构r-N结构

超对称顶点代数和超对称李共形代数的某些结果

超对称顶点代数是顶点代数的推广.本文研究了超对称顶点代数和超对称李共形代数的交换性和幂零性以及单超对称顶点代数与其相伴的超对称李共形代数之间的关系.讨论了超对称顶点代数的表示,证明了其表示满足弱结合性.进一步,建立了超对称空间下的场代数和超对称顶点代数的联系.最后给出了超对称李共形代数广义导子的相关结果.

学位

超对称顶点代数超对称李共形代数场代数广义导子

粘性依赖密度的可压缩NAVIER-STOKES方程球对称强解的整体存在性研究

本文,我们研究了二维有界区域上粘性系数依赖密度的可压缩Navier-Stokes方程(Kazhikhov模型)的初边值问题。在β>1的条件下,证明了Dirichlet边值球对称强解的整体存在性。

学位

强解整体存在性球对称可压缩Navier-Stokes

基于广义高斯混合模型的数字图像修复算法研究

图像复原问题在数字图像处理研究领域中是一类重要的研究问题,这一问题包括数字图像去噪、去模糊、修复以及超分辨率等。近些年来,期望块对数似然(Expected Patch Log-Likelihood,简记EPLL)算法作为一种图像复原算法受到了学界的广泛关注。EPLL算法以统计先验模型和最大似然估计为基础对图像块进行处理,EPLL算法的优越性在于它可以与任何统计先验模型相结合,并且在实践中可以提供十

学位

广义高斯分布广义高斯混合模型EPLL算法模型图像修复图像超分辨率

转置泊松超代数

转置泊松超代数是转置泊松代数的一种推广.本文在此基础上得到了转置泊松超代数张量积仍是转置泊松超代数的结果.通过几类相关的超代数的研究,构造出了新的转置泊松超代数.接着研究了转置泊松超代数的中心扩张及泛中心扩张.进一步,引入了泊松3-李超代数和转置泊松3-李超代数的概念,获得了转置泊松超代数与3-李超代数和转置泊松3-李超代数之间的联系.最后,我们引入了pre-李超代数上N超算子、O超算子及R-B超

学位

转置泊松超代数张量积Novikov-泊松超代数pre-李超代数泛中心扩张3-李超代数超算子

基于深度学习方法的蛋白质泛素化位点预测方法研究

与本文相关的学术论文