基于终身机器学习的蛋白质分类问题研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:sonical
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学渗透着生命科学的方方面面,如何利用计算机快速针对蛋白质进行分类一直以来都是计算机科学和生物信息学的热点研究问题。另外,对于蛋白质分类问题,如何进行有效地增量学习一直以来是研究的空缺,同时这也是终身机器学习算法的一个难点。本文基于终身机器学习的思想,针对蛋白质家族数据构建了两个可以进行有效增量学习的多分类模型,该模型扩展了终身机器学习的应用领域,为生物信息学中多分类问题的研究提供了新的思路。本文的主要研究内容和贡献如下:1.数据方面,本文针对PFam数据库中的蛋白质家族数据进行归类,为终身机器学习模型的研究提供了一个具有标注严格,去除冗余的蛋白质家族数据集。该数据集由于具有大量任务并且每个单独任务数据样本较少,十分适合进行终身机器学习模型以及任务关联发现的研究。并且本文利用多种方法分别从计算机以及生物学的角度构建氨基酸序列特征,该特征在本文提出的两种模型上均取得了很好的分类效果。2.算法方面,本文根据是否保留历史任务的训练数据分别设计了两种终身机器学习方法。本文通过对SVM多分类模型进行拆分,使其在子任务上可以选择更加合适的特征子空间,在保留历史任务训练数据的情况下可以进行有效的增量训练。此外,本文将自编码器能否有效还原输入特征向量作为分类的判定条件,创新性的在隐层引入了前置任务损失和均值损失,构建了不需要保留历史任务训练数据的终身机器学习分类方法。3.服务方面,基于SVM终身机器学习方法,本文构建了针对蛋白质家族分类任务的Web服务,该服务目前支持26个蛋白质家族的分类,在该任务上模型最终的Accuracy,Specificity,Sensitivity以及MCC指标分别达到0.9934,0.9995,0.9873以及0.9869,表明了本文提出算法的有效性。
其他文献
对于自适应光学人眼眼底成像系统,由于人眼波前像差具有动态特性,为获得清晰、高分辨率的眼底图像,变形镜必须能够实时跟踪并补偿人眼中随时间变化的像差信息.本研究探讨自适
<正> 所谓封建迷信,一般系指由旧社会遗留下来的,以信仰神灵鬼怪等并不存在的超自然力量为特征的陈腐陋习,它是愚昧无知的产物,是消蚀人们斗志,阻碍社会进步的“精神鸦片”。
会议
研发一种用于抑制腕部病理性震颤的功能性电刺激(FES)康复系统,包括信息处理、控制器设计、仿真建模以及实验测试.仿真阶段利用Matlab软件构建了腕关节肌肉骨骼模型;设计控制器
步入二十一世纪,我国经济稳中向好健康发展,为满足不断增长的社会需求,“新基建”应运而生,从交通、市政、人工智能等方面提供多方位保障,人们生活水平显著提升。与此同时,环境问题日益严峻,河流、土壤等关乎民生的资源正遭受严重污染和破坏,不仅阻碍了经济社会的发展,对民众的健康也造成很大威胁。为此,习总书记提出“两山论”,社会的可持续发展离不开健康的生态环境,生态保护和乡村振兴已上升至国家战略。然而,水土环
<正>Chinese Premier Wen Jiabao&#39;s visit to South Korea and Japan is a great success in strengthening mutually beneficial cooperation and promoting the econom
近年来,高熵合金以其独特的设计理念和优异的力学性能引起了广泛的关注。不同于传统的合金设计理念,高熵合金往往包含五种以上的主要元素以近似等原子比进行混合。其主要设计
<正>2007年是马礼逊对华宣教200周年,境外的一些基督教团体和相关学术组织已开始举行了多种形式的纪念活动。其中有些人欲借此机会, 鼓吹对华宣教,提出所谓的“用福音占领中
会议
<正>将自抗扰控制技术应用到飞机飞行姿态控制中,使用MATLAB仿真和APM硬件在回路仿真对自抗扰控制器进行设计和参数整定,以开源的无人机自动驾驶仪APM作为实验平台在飞机纵向
会议
目的探讨1.8 GHz射频辐射对小鼠股骨显微结构和骨代谢的影响。方法 30只4周龄的C57BL/6雄性小鼠随机分为射频辐射(RF)暴露组和假暴露(Sham)组,每组15只。RF组小鼠自由体位暴
高校自扩招到现在,就业问题已经成为社会广泛关注的问题,女大学生的就业问题更是研究得比较广泛。本文通过对高校女大学生就业现状及就业难的主客观原因进行浅析,思考和探讨