基于mRMR结合SVM-forward特征选择的蛋白质界面上热点残基预测及其生物上的应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:yaleqd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年生命科学的研究方向随着基因工程的工作步入尾声之后开始逐渐转向基因的功能,又因为基因的功能在细胞水平上所呈现的全部生命活动都是通过蛋白质之间相互作用方式直接或间接地实现,例如:DNA复制、信号传导、调节机制、DNA转录和基因翻译等活体细胞各个水平上的必不可少活动,所以在后基因组时代中蛋白质之间的相互作用已然成为关键研究方向之一。大量研究证明在蛋白质相互作用网络中只有极少数残基在它形成过程中释放出比较多能量,对于其他大部分残基而言,那些少量残基是在蛋白质结合过程中所产生自由能的主要提供者,后来研究人员将这些主要贡献的残基定义为热点残基(Hot Spots)。热点残基其实是位于蛋白质结合界面上的一小簇残基团,它们是以聚集形式分布在蛋白质界面上,并不是以均匀方式存在。热点残基虽然占据的蛋白表面面积非常小,但是它们在蛋白质-蛋白质的自由结合中充当非常重要的角色。热点残基深刻地影响着蛋白质功能的发挥并且对维护蛋白质结合界面的稳定性有着十分关键的作用。虽然目前通过生物实验技术可以发现蛋白质-蛋白质结合界面上的热点残基,但是这个方法复杂,并且由于昂贵和耗时等原因而不能被广泛的应用。所以很多研究者尝试使用其它预测的方法比如基于计算预测,其中主要包括基于经验公式和机器学习进行热点残基预测,这些方法虽然取得一些成果,依然存在很大提升空间。本文采用机器学习方法进行热点残基的预测,我们从氨基酸理化、蛋白质序列、结构和蛋白质的相互作用等方面上提取了 143个特征,之后,我们采用最小冗余特征选择算法结合前向支持向量机算法从中筛选出41个特征,并且利用随机森林算法构建模型,和其他文章方法相比之下,本文在独立测试集上的预测指标F1和MCC分别达到了 0.625和0.518。我们称这种方法为HPcms。并且经过特征筛选后,本文的新特征依然是预测结果的重要特征。最后,本文将很多热点残基预测工具集成并进行生物上的应用:预测抗体-抗原(抗原是蛋白质情况下)结合中表位上的热点残基,之后使用开源软件RosettaMultigraft模块以计算机模拟方式对我们实验室的蛋白质结构3ztn.pdb上两段表位移植到其他蛋白质支架上,经过计算机层面上的筛选后,进行生物实验。通过生物实验对比和结果上分析,本文提出的集成热点残基预测方法对于抗体-抗原上表位上的热点残基预测和表位移植发挥重要作用。
其他文献
目前我国失独家庭规模已超百万,加之人口老龄化与家庭空巢化相重叠的时代背景,这类特殊群体的养老问题已成为公众关注的热点。通过定性访谈及参与观察发现,失独家庭存在物质
公有制为主体、多种所有制经济共同发展的基本经济制度,其两大特征是公有制主体和混合所有制经济。这两大特征在宏观上体现为公有制为主体的多种所有制经济共同发展的所有制
目的分析对糖尿病肾病并发高血压患者采用氨氯地平+厄贝沙坦联合治疗的效果。方法将112例糖尿病肾病并发高血压患者随机分成观察组和对照组,各56例。观察组给予氨氯地平+厄贝
目的分析尿微量白蛋白(MAU)水平与冠心病(CHD)患者冠状动脉血管病变程度的相关性。方法收集2009年3月至2013年11月在我科住院的CHD患者967例,行冠状动脉造影(CAG)检查前检测M
一、商标滑稽模仿概述滑稽模仿,又称戏仿,最初产生于版权法领域,是一种独特的艺术表现形式。《布莱克法律词典》将滑稽模仿定义为:“对知名作品进行转换性使用,以达到对原作
作为视觉艺术的一个重要门类,版画的发展历程是漫长曲折的,但这并不妨碍版画艺术在人类艺术发展史上开出璀璨绚烂的艺术之花。当代版画艺术更是渗透进大众生活的方方面面。色
<正>云计算作为IT领域新兴技术,已经在相关行业得到了很好的应用,云存储、云安全等行业应用给行业发展提供了强大的发展动力。云支付是云计算在支付领域的最新应用,在支付系
采用湿润育秧,研究了不同育秧方式(秧盘不垫铺麻纤维膜育秧和秧盘垫铺麻纤维膜育秧)和育秧肥不同施用方式(100%秧土混施、50%秧土混施+50%秧土底部撒施、100%秧土底部撒施)下
目的探讨米非司酮联合桂枝茯苓丸治疗子宫肌瘤的疗效。方法 100例子宫肌瘤患者随机分为治疗组和对照组两组,n=50。对照组口服米非司酮12.5mg/d,1次/d;治疗组口服米非司酮12.5