基于小波变换和集成学习的蛋白质相互作用预测方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zhaoziyuan123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质在生命体的日常活动中扮演着最为关键的角色,大多数细胞正常生理功能最终需要由产生与结合的蛋白质代为实现,蛋白质通过两两间、或多蛋白间相互结合实现蛋白之间的功能。一直以来传统的研究蛋白质结合的实验方案已经积累了相当的各类蛋白质相关信息与相互作用信息,但是这些方法大多存在局限性,尤其是检验速度无法满足进一步研究的要求。近年来研究人员利用机器学习工具结合蛋白质特征编码算法对蛋白质相互结合网络进行预测,不断提出了提高预测精度的方法,然而经过实验,我们发现多数预测方法在更严格的数据集面前效果并不理想。本文使用幽门螺杆菌、酵母菌和拟南芥的蛋白质数据库,结合小波变换对蛋白质序列信息提取的编码算法,研究利用多种机器学习方式预测同物种中的蛋白质相互作用及迁移学习下不同物种中蛋白质相互作用。主要内容如下:在第二章中,首先使用Database of Interact Protein(DIP)蛋白数据库的幽门螺杆菌、酵母菌和拟南芥的蛋白质相互作用正负数据集,然后用小波变换的方法转化了蛋白质一级结构从而对数据集中的蛋白质作用对进行编码,使用stacked generalization结合四种广泛使用的基分类器以及logistic regression算法综合输出了对幽门螺杆菌、酵母菌以及人类的蛋白质相互作用预测,最后对预测结果进行了分析。实验结果显示新的集合算法体现出了良好的预测性能,并在不同数据集上工作稳定,是值得进一步发展运用的良好算法。第三章中,我们将新算法与学界广泛认可的Tradaboost算法,在自制的蛋白迁移数据库上进行测试。从测试结果上看,我们新提出的算法同样的取得了较好的预测能力,在本实验的几项评估标准中同样展现出了优于Tradaboost算法的特点。然而在多组算法的对比中我们发现物种间蛋白相互作用规律并不通行的特点,使得目前的基于序列的蛋白质相互作用预测都无法在跨数据集的条件下进行。
其他文献
氯氮平是非典型抗精神分裂的代表药物,在治疗精神分裂疾病中起到重要作用,临床实践发现,不同个体对氯氮平的反应有较大差异,研究表明,遗传因素是导致氯氮平疗效产生个体差异
目的:建立百部总生物碱缓释片的质量控制标准。方法:采用薄层色谱法对百部总生物碱缓释片中对叶百部碱进行定性鉴别,采用固相萃取-高效液相-蒸发光检测法建立百部总生物碱缓
研究了复合酶制剂在玉米原料酒精发酵中的应用,经优化后木聚糖酶、纤维素酶和酸性蛋白酶最适添加量为:木聚糖酶170 U/g原料、纤维素酶16 U/g原料、酸性蛋白酶14 U/g原料,料水
针对智能电网环境下,各类不确定因素对电网需求响应调度策略的实施效果存在较大影响的问题,提出一种计及用户参与不确定性的用户响应模型,将用户参与度和电网侧激励间的关系
<正>人类社会发展过程早期阶段,在城市兴起之前,许多社会功能是处于自发的分散、无序状态中。随着城市的兴起,人们才逐渐聚拢到一个有限的地域环境之内,各种要素的聚集和相互
<正>科学合理的体育训练并不会影响文化学习,相反能促进学习成绩的提高,两者不存在矛盾。准备体育高考的考生,不仅要求体育高考成绩上线,同时要求文化成绩达到录取线,也就是
描述了灰度修正技术在数字图像处理中的重要性及其实用价值,并详细介绍了各种方法的原理、实现过程及其适用范围和优缺点,为不同的实际需要选择不同的方法提供了理论依据。
工农业生产中常需要长时间低功耗的无线数据组网采集,节点设计是关键技术之一。本文设计一种基于ZigBee技术的无线数据采集的功能节点,给出基于簇树路由协议的组网和数据传输
古代漆奁历经数千年的发展,既反映了手工艺时代一般器物发展的演进机制,呈现出由实用性到观念性和艺术性的趋势,又在其胎骨技术、功能结构、装饰手法等方面集中体现了我国漆
探讨酒中生物胺对小鼠行为学及脑中5-羟色胺含量的影响。建立48%vol食用酒精对小鼠饮后上头和醉酒的实验模型,确定旷场实验、爬杆时间和翻正反射在模型中的评价作用;配制不同