论文部分内容阅读
癌症因其多因素参与性和阶段性复发性而成为导致人类死亡的主要原因之一。差异表达蛋白质作为重要的肿瘤标志物,被广泛运用于癌症的病理研究,预后预测以及药物靶向治疗。随着质谱技术的快速应用,大量癌症相关的差异表达蛋白质被鉴定出来,并分散于各类质谱文献中。合理规整这些数据以方便癌症研究人员使用成为亟待解决的问题。因此,本课题组首次创建了基于质谱实验的人类肿瘤相关的差异表达蛋白质数据库(dbDEPC),并在2012年更新到了2.0版本。近年来,在质谱和计算机技术的推动下,肿瘤相关的差异表达蛋白质数据迅速增加,及时更新dbDEPC显得十分重要。因此,本研究将dbDEPC进一步更新至3.0版本,dbDEPC 3.0不仅体现在数据的更新上,更体现在其功能的拓展上。通过严格的文献筛选标准,我们共收集了来自779个质谱实验,26种人类癌症类型的11669个差异表达蛋白质,数据量比之前的版本增加了近两倍。同时,相应的网页搜索和浏览功能也大大改进。一方面,考虑到在蛋白质组学的不同层面表征蛋白质的变化信息有利于进一步挖掘癌症发生的分子机制,因此本研究首次对差异表达蛋白质进行了多层次注释,包括癌症相关的肽段氨基酸突变注释,蛋白质翻译后修饰注释。另一方面,由于网络方法在确定药物靶点方面具有很大优势,本课题还在不同的网络层面对蛋白质进行了药物靶标注释,希望有助于网络层面的药物发现。最后,提供了一个在线的通路富集分析工具,方便研究人员在通路中查询差异表达蛋白质的分子作用关系,dbDEPC 3.0的网址是:https://www.scbit.org/dbdepc3/index.php本研究还基于当前存储的数据和提供的富集分析功能,为dbDEPC 3.0在癌症研究中的应用做了实例展示,以此来说明数据库的应用场景。首先,对特定主题实验的指导作用,用户可以运用该数据库实现对关键蛋白的预测并指导生物实验验证。其次,差异表达蛋白质的一致性规律分析,用户可以通过对差异表达蛋白质的一致性分析,获取特定蛋白质在癌症研究中的表达偏向性以及参与的生物学通路共性,除此之外,研究人员还可以展开类似的跨癌症类型分析。总之,dbDEPC 3.0旨在为癌症差异表达蛋白质研究提供一个综合数据查询和分析的平台。我们相信dbDEPC数据库的开发可以加速蛋白质组学和癌症组学之间的研究。