论文部分内容阅读
从人类基因组的破译,到基因组学、转录组学、蛋白组学等组学技术的快速发展,都为药物研发与药靶发现提供了机遇和挑战。但是,随着药物、药靶的研究的不断深入,药靶发现进程由于一些关键问题而大大延迟,比如:1)治疗药靶定义模糊,2)临床试验药物及其药靶覆盖率不足,3)耐药性突变信息不足;4)药靶基因表达谱信息和药靶组合信息不足,5)缺乏成功药靶、临床药靶和药靶组合的可药性特征,6)现有药靶预测工具预测能力较弱,等。为了解决这些问题,本研究在药靶严格确证的基础上对药靶可药性进行了系统性分析,并构建了药靶预测新型算法,具体讨论如下。第一,提出了严格的基于药、靶、病三者关联的药靶确证新策略。药靶的确证不仅需要考虑药物对药靶的活性,更要先通过活体实验(基因敲除等)验证药靶在疾病模型中的作用,再找到药物对药靶的作用会在疾病模型(细胞、体外或活体)中产生疗效的证据。第二,在药靶严格确证新策略的基础上,确证了大量批准和临床药物的药靶,并收集了多种对药靶研究有重要作用的信息。这些信息包括:大量的临床药物和临床药靶数据;药物及其药靶与生物通路的交叉信息;耐药性突变信息;药靶基因表达谱信息;药靶组合信息。在完成对以上信息的收集与计算后,将其整合进治疗药靶数据库(TTD)中,方便其他科研人员使用。同时从网络技术层面重新构建了TTD数据库,使用更先进的网站技术、更合理的底层架构,从而提升数据库的使用效率。第三,完成了对创新药靶的研究进展及其特征分析。本文以2004-2017年间成功的创新药靶为基础,开展了药靶可药性研究。具体分析了药靶类型,药物类型,靶向疾病类型,政府调控政策等对这些药靶的临床试验进展的影响。对这些药靶在疾病过程中所起到的作用,药物与药靶结合的差别,生物化学,结构,序列,生物系统因素等也进行了进一步分析,得到了能显著区分临床试验进展快和慢的量化特征。第四,深入到激酶组,针对FDA批准的多靶点药物和组合药物的药靶组合开展了药靶组合的可药性研究。通过对多靶点药物和组合药物所构建的药物-药靶网络和系统进化树的分析,确定了多靶点药物和组合药物中最受偏好性的药靶,并且揭示多靶点药物和组合药物在药靶组合方式上面的不同。同时,还比较了批准的多靶点药物和组合药物在作用机制上的差异。这将有助于利用下一代网络药理学思路探索发现更多有效的新型药靶组合。第五,基本完成了对药靶预测算法的构建。在完成药靶严格确证和TTD数据库的升级之后,有足够数量的准确数据为后续的药靶预测提供数据支撑。在此基础上,应用了基于Pfam的虚拟负数据集构建新方法,构建了药靶预测新型算法,显著降低了模型的假阳性。同时在完成对创新药靶的特征分析之后,得到了能显著区分临床进展快慢的特征,这些特征包括生物系统特征(相似蛋白数量,所分布的人体组织数量,所参与生物通路的数量)和蛋白质网络特征等。计划在后面的药靶预测工具开发中应用这些特征谱,进一步提高药靶预测准确性。药靶的可药性作为一种特殊且更复杂的蛋白质功能,为此本研究在完成药靶预测新型算法构建的基础上,对蛋白质预测工具SVM-Prot进行了重要升级,大大提高了SVM-Prot的预测准确性,为后续药靶预测工具的开发做好了铺垫。综上所述,本文从当前药靶发现中存在的问题出发,建立了药靶严格确证新策略,之后收集并计算得了到对药靶研发有重要作用的数据(临床药物及临床药靶;药物及其药靶与生物通路的交叉;耐药性突变;药靶基因表达谱;药靶组合),再整合到TTD数据库中。在完成药靶严格确证,和药靶相关重要信息的整合后,开展了药靶可药性研究。以近十四年的创新药靶出发,分析得到了能显著区分药靶临床进展快慢的特征,为药靶可药性判断标准的建立打下了基础。以FDA批准的靶向激酶的多靶点药物和组合药物为基础,在药物-药靶网络和系统进化树等方面系统分析比较了多靶点药物和组合药物的共性与差别。最后在药靶严格确证,和药靶可药性发现的基础上构建了药靶预测新型算法,并将所构建的药靶预测新型算法应用于蛋白质功能预测,并表现出良好的预测性能,为后续药靶预测工具的建立做好了准备。