利用SVM挖掘GPCR中潜在的药物靶点

被引量 : 0次 | 上传用户:haokanhaowan123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:药物靶点的定位是药物开发成败的关键。然而,目前被临床验证的药物靶点的数量还很少,因此迫切需要挖掘更多的新药物靶点。在已知的药物靶点中G蛋白偶联受体(GPCR)占绝大多数,它和高血压、哮喘、疼痛、神经和免疫紊乱等多种疾病有着密切联系。由于GPCR其七次跨膜构象复杂,空间结构很难从实验中获取,因此,它们的功能就更难确定了。在本研究中,我们结合蛋白质序列、多肽、及蛋白质基本理化性质等特征构建支持向量机(SVM)分类器,来预测GPCR中潜在的药物靶点,为药物开发提供理论支持。方法:本研究利用SVM方法,通过对GPCRDB,Uniprot,DrugBank三大数据库中蛋白质序列的筛选,构建两组不同的分类器来预测GPCR中潜在的药物靶点。一类分类器是将人类确认的药物靶点作为阳性结合,筛选得到的非药物靶点作为阴性集合;另一类分类器是将确认为药物靶点的GPCR作为阳性集合,筛选得到的GPCR非药物靶点作为阴性集合。对以上两组蛋白序列中每一个序列提取其相应的蛋白质的一级结构、多肽特征及蛋白质的基本理化性质特征,作为训练分类器的特征空间。利用遗传算法实现特征空间的选择,并通过对模型参数的调整来构建两组最优分类器。最后,将这两组最优分类器都用于对GPCR潜在药物靶点的预测。结果:根据第一组数据集合训练的分类器其分类的准确率为72.63%,敏感度为77.44%,特异度为67.55%。第二组分类器的准确度,敏感度、特异度都在95%左右。将这两组分类器用于对未分类的GPCR集合预测,发现其中有141个GPCR同时被这两类分类器预测阳性,这个比例占到了整个GPCR的17.5%,这一结果对GPCR的研究有着很重要的参考意义。结论:通过构建两组分类器来实现对GPCR药物靶点的预测,两组分类器相互验证,增加了分类结果的可信度。在这些同时被预测为阳性药物靶点的141蛋白质中,其中有39个在治疗靶点数据库中能找到,这也进一步证明了此方法的可行性和正确性。
其他文献
随着人们物质生活的提高,人们开始追求更高质量的生活,越来越关注人类自身的生存、发展,而且把人类的生命和健康看得尤为重要,用中国传统文化来形容就是,人类更加注重养生之道。人
中国的书法是一门古老悠久的汉字书写艺术。从最早殷商时期的甲骨文一直到现在,书法艺术已经在历史上演变发展了3000多年。从书法的书写样式上大致可以分为篆书、隶书、草书
目的:分析治疗前血清鳞状细胞癌抗原(SCC-Ag)水平与宫颈上皮内瘤变(CIN)患者病变程度的相关性,探讨其早期发现宫颈浸润性癌患者的预测价值。方法:回顾分析了在我院初次经阴道镜活检
随着我国经济的高速发展,城镇化建设的加快,人们的生活水平将会不断提高,同时对下一代的培养力度也会不断加大。中小学阶段的青少年,身体的成长几乎是每天都有变化。而攀岩则
当今社会发展迅速,竞争也日益激烈,心理承受的压力也就越来越大,心理健康的问题越来越被人们关注。拥有一个健康的心理具有非常重要的意义,同时身体自尊也不能被忽略。本研究采用
面齿轮传动是一种由圆柱齿轮与圆锥齿轮相啮合的新型齿轮传动,具有结构简单、重量轻等优点,面齿轮在分流—汇流传动方面的独特性,使其在航空领域,尤其是新型战斗直升机中的应用表
随着中国国际地位的提高,越来越多的外国人开始学习汉语,其中海外华裔占据了很大比重,印尼的华人华侨数量位居世界第一,目前华文学校已是印尼教育体系中不可缺少的一部分,整个印尼
随着中等职业技术学校学生在青少年群体中所占比例的逐年增长,中职生群体已经逐渐成为一个不容忽视的群体。中职生有不同于普高生的心理特点,而农村学生的心理特点又有别于城市
介绍了时间双向传递技术的基本原理,分析了运动双站的时间双向传递的误差源及误差源对同步精度的影响。
目的和意义结直肠癌(colorectal carcinoma, CRC)是我国第三位最常见的恶性肿瘤,并且近年来其发病率呈逐年上升趋势。在结直肠癌发病早期,90%的病人可通过手术治疗治愈,然而,