基于深度学习的尿液排泄蛋白预测方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:zyb1026
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
疾病生物标志物在检测疾病以及研究疾病发生和发展的机制中起着重要作用。目前,检测血液、尿液和唾液等体液中的生物标志物是诊断疾病的有效方法之一。由于血液中有许多信号指示各种生理和病理生理状况,因此有关体液生物标志物的大多数研究都集中在血液上。而近年来,随着蛋白质组学技术的提高,研究人员发现尿液也是对疾病进行检测的理想来源之一。并且与血液相比,因为尿液的成分相对简单,可以轻松、无创地获得,所以尿液是更好的生物标志物来源。因此,尿液中的排泄蛋白是体液中最常用的生物标志物之一。在计算识别尿液排泄蛋白的基础上,进一步结合转录组或蛋白质组学数据,可以为预测尿液中的疾病生物标志物提供非常有用的信息。目前,只有很少的基于机器学习算法的模型来预测尿液排泄蛋白,并且这些模型都非常依赖于从尿液排泄蛋白中所提取的特征,所以这些模型很可能由于特征构建的不完整或者特征选择的偏差导致预测性能的不足。在本文中,我们提出了一种用于预测尿液排泄蛋白的深度学习模型。与现有的尿液排泄蛋白预测方法不同,我们提出的模型通过使用基于位置特异性迭代的基本局部比对搜索工具(PSI-BLAST)所得到的位置特异性打分矩阵(PSSM)所表示的氨基酸序列进行预测。模型的框架主要由从位置特异性打分矩阵中提取局部信息的卷积神经网络(CNN)模块,用来提取远距离氨基酸相关性的双向长短期记忆模块(BLSTM)和获取预测尿液排泄相关氨基酸位置的注意力模块组成。构建模型之后,我们验证了所提出模型在训练数据集和独立测试数据集上能够达到91.25%和88.98%的准确率,并且所得到的预测结果优于基于传统机器学习的模型。进一步结合转录组和蛋白质组学数据,我们的模型可以对预测尿液中对应疾病的生物标志物提供非常有用的信息。通过将已知的尿液蛋白生物标志物与我们的模型结果进行比较,我们发现对于多个研究中所检测到的尿液蛋白生物标志物,我们的预测模型可以达到80%以上的真阳性率。我们还将模型与肺癌患者的转录组和蛋白质组学数据进行结合分析,以预测肺癌的潜在尿液蛋白生物标志物。同时,为了方便生物医学研究人员使用,我们还开发了用于预测尿液排泄蛋白的网络服务器。我们所提出的预测模型和开发的服务器对于从事尿液蛋白生物标记物预测研究的生物医学研究人员来说具有实用价值,尤其是当这些研究人员需要使用转录组或蛋白质组学数据来分析所得到的疾病组织的差异表达基因或者蛋白时。
其他文献
研究背景:动脉粥样硬化(Atherosclerosis,AS)是一种以大中动脉内壁脂质沉积为特点的慢性炎症性疾病。AS的发病机制复杂,病程缓慢,并且疾病的不断进展往往会引发冠心病、脑梗
ACE2(angiotensin-converting enzyme 2)是肾素-血管紧张素系统(renin-angiotensinsystem,RAS)的新成员,且在肠道中分布广泛。近期的研究发现,AC E2在大鼠和小鼠体内均与肠道
推进城市间的协调发展和城市群的协同推进是国家区域发展战略的重要内容,而诊断问题与优化对策的关键是正确的揭示城市群区域流动空间特征,这也是实现可持续发展的关键。本文
柑橘木虱(Diaphorina citri Kuwayama)属半翅目Hemiptera,木虱科Psyllidae,主要危害芸香科植物。该虫不仅通过吸食寄主叶片对其造成直接伤害,最严重的危害是能传播柑橘黄龙病,给柑橘产业造成严重的经济损失。柑橘木虱的防治长期以化学防治为主,尤其是噻虫嗪和吡虫啉等新烟碱类杀虫剂在柑橘木虱防治上被广泛利用,使得柑橘木虱对此类药剂已产生不同程度的抗药性。目前,在柑橘木虱
碳材料因其独特的结构、高的表面积、优异的导电性以及高的稳定性等,受到了科研界极大的关注,但是碳材料本身催化活性有限,片层结构易堆叠,这也造成了其应用受限。过渡金属化
具有kesterite结构的Cu_2ZnSn(S,Se)_4(CZTSSe)是一种直接带隙半导体,由于其合适的光学带隙、高的吸收系数、丰富的元素储备和对环境友好,被认为是制备高效、低成本太阳能电池的理想吸收层材料。但是,目前CZTSSe薄膜太阳能电池最高转换效率(PCE)仅为12.62%,远低于其极限转换效率(32%)和Cu(In,Ga)Se_2薄膜太阳能电池光电转换效率(22.9%)。研究表明导
荔枝皮富含原花青素,具有显著的抗动脉粥样硬化活性,但是原花青素的小肠吸收率极低。研究显示,肠道菌群代谢可能在原花青素生物活性作用过程中发挥着重要的作用。本文采用人
MicroRNA是一类非编码单链RNA分子,长度约为22个核苷酸,普遍存在于真核生物体内,参与多种生命过程的调控。miRNA在鸡的生长、发育、代谢等生理过程中发挥着非常广泛的基因调
现代经济社会的发展离不开能源。化石能源的开采已接近枯竭,绿色环保的可再生能源逐渐成为能源领域的重要角色。其中,太阳能作为最有发展前途的绿色能源,引起了人们的广泛关
随着养猪业迅速发展,粪尿中大量氮磷对环境的影响日益严重。虽然饲料添加酶制剂能有效降低氮磷排放量,但是饲料高温高压等加工工艺和贮存条件导致酶的损失率高且效果不稳定。