【摘 要】
:
蛋白质亚细胞定位预测是指对某种蛋白质或者是基因表达产物所在细胞内的具体存在部位进行预测,即根据蛋白质序列中所包含的特征信息,经过预测算法的分类识别,预测其所在的亚
论文部分内容阅读
蛋白质亚细胞定位预测是指对某种蛋白质或者是基因表达产物所在细胞内的具体存在部位进行预测,即根据蛋白质序列中所包含的特征信息,经过预测算法的分类识别,预测其所在的亚细胞位点,即细胞器。蛋白质的亚细胞位置和其功能高度相关,同时也是蛋白质组学研究的基础。蛋白质是一切生命活动的物质承担者和执行者。但是,其功能的表现依赖其所在的亚细胞位点,只有处于特定的正确的亚细胞位置,蛋白质才能充分发挥其功能,才能正常的参与各项生命活动。蛋白质处于正确的亚细胞位点是生命体正常有序运转的前提和保障。因此,蛋白质的亚细胞定位预测对于机体生理机制的研究是非常有意义的。此外,明确蛋白质的亚细胞位点,对许多疾病发病机理的研究和靶细胞药物的研发都起着至关重要的作用。近几年,随着计算机科学以及生物技术的发展,由高通量实验积累的蛋白质数量呈几何级增长,传统的试验方法费时费力,已经难以满足定位研究的需要。因此,人们通过使用机器学习的方法来对海量的蛋白质进行定位预测。研究还发现有些蛋白质不仅只含有一个亚细胞位点,有的蛋白质在两个甚至是多个亚细胞中存在或者是游动。根据DBMLoc的统计,在所有的已经发现的蛋白质中,超过30%的蛋白质含有多个亚细胞位点。这类蛋白质通常具有特殊的功能,具有对机体更加重要的生物学意义。开发能够快速准确的鉴定新发现蛋白质多个亚细胞位点的计算方法成为了重中之重,多位点蛋白质的数量在不断的增加,因此,蛋白质的亚细胞定位预测开始向多位点定位预测方向发展。蛋白质的多位点定位预测比单位点预测要复杂的多,其本质属于典型的多标记学习问题。因此研究者们纷纷将注意力转移到近来发展迅速的能够处理多标记学习的机器学习方法上来,并取得了较好的成果。就预测步骤而言,蛋白质亚细胞多位点定位预测和单位点定位预测类似,包括以下四个方面的内容:一是数据集的构建,二是对蛋白质序列的特征表示,三是分类算法的设计与实现,四是对预测算法进行评价。本文选择使用两个基数据集:一个是Virus-mPloc分类器中的数据集,另外一个是Gpos-mploc分类器中的数据集。这两个数据集都同时包含单位点蛋白质和多位点蛋白质序列。本文采用的特征提取方法有N端分选信号、伪氨基酸组成模型(PseAAC)、理化组成(PC)、氨基酸指数分布(AAID)和立体化学性质(SP)。在特征提取的过程中,首先将N端分选信号和伪氨基酸组成模型组合起来,即先将氨基酸序列分成两段,然后用伪氨基酸组成模型表示蛋白质序列,得到一个80维的特征向量。然后在整条蛋白质序列上提取理化性质、氨基酸指数分布和立体化学特征,分别得到21维、40维和10维的特征向量。然后分别在两个数据集上采用不同的特征融合方案进行特征融合并得到不同维数的特征向量,经多标记K近邻(ML-KNN)算法的计算以及JackKnife方法的验证,最终在两个数据集上选取适合于本数据集的最佳的特征融合方案。取得了较好的预测效果。与柔性神经树的预测效果相比,ML-KNN算法的预测结果明显较好。
其他文献
目的1.制定集束化护理措施,构建有效减轻早产儿反复操作性疼痛的干预方案。2.探讨集束化护理对早产儿反复操作性疼痛的干预效果以及该效果是否具有持久性,为临床护理人员开展早产儿疼痛干预提供依据。方法本研究为随机对照研究设计。采用便利抽样法,选取2018年3月至2018年12月在连云港市第一人民医院新生儿重症监护室58例32至36周早产儿作为研究对象。采用简单随机分组方法,利用随机数字表,将早产儿分为干
多杀菌素因其具有对靶标害虫的高效性和环境友好性特征而被广泛用于农作物害虫以及动物寄生虫的防治。野生型刺糖多孢菌多杀菌素的生物合成能力很低,因此利用基因工程改造刺
眼睛作为人体一个重要器官,通过众多精密的部分协同工作,给了人类视觉并更多地了解周围的环境。青光眼作为全球第二大致盲眼科疾病,越来越多人受到影响。通过促进房水的流出控制眼压是目前已知唯一且有效的治疗方式。近年来,针对如何准确有效治疗青光眼提出了一种新型的粘小管成形术技术,该技术对比之前的小梁切除术在青光眼治疗效果上有了很大的提升,然而,因为人为操作的原因及由此导致的术后并发症对手术的成功率仍有着很大
随着汽车工业的不断发展,汽车轻量化问题备受关注,而高强钢因具有优异的综合力学性能而成为广泛应用的汽车用钢。本论文主要研究了两种高强汽车用钢:含Cu低合金铁素体钢和55Cr Si高强弹簧钢。首先,以含Cu低合金铁素体钢作为研究对象,结合淬火&配分(Q&P)+等温时效工艺,制备出具有一定残余奥氏体和富Cu析出相的低合金铁素体钢,实现高韧性(铁素体+一定量的残余奥氏体)和高强度(富Cu相
协调控制系统作为一种平衡机炉能量供需的解决方案,广泛应用于各类燃煤机组的生产过程中。然而,经典的协调控制系统无法完全克服锅炉侧的大延迟大惯性,致使部分关键参数出现超调与波动,严重影响系统控制品质以及机组运行的安全稳定性。随着智能电站概念的提出,越来越多的智能算法被用于优化协调控制系统。研究一种能够准确预测信号未来变化趋势的算法模型并嵌入控制回路中,对提升控制系统响应能力、保证机组运行效率、维持关键
随着我国低空空域飞行活动的日益增加以及低空空域的逐步开放,在新一代导航监视技术发展及应用的背景下,广播式自动相关监视技术(ADS-B)在低空空域安全飞行方面得到广泛应用。本文对ADS-B系统的主要工作原理进行了研究,重点对ADS-B IN技术进行了分析,同时分析了ADS-B标准报文格式与CPR算法的主要实现过程。在ADS-B报文中关键信息数据解析出来的基础上,研究利用改进的残差均值交互多模型(RM
高级驾驶辅助系统ADAS(Advanced Driver Assistance System)作为一项关键的主动驾驶技术,对于提高行车安全,减少交通事故的发生具有重要意义。车辆前方行人碰撞预警系统是ADAS的重要组成部分,对潜在的人车碰撞事故进行精确评估与预警,最大程度的减少人车碰撞事故的发生。论文针对车辆前方行人检测及预警问题,围绕基于图像和激光点云的车辆前方行人碰撞预警方法展开。本文的主要研究
目的本研究探寻Ubc9和SUMO通路对鸡胚早期发育时期神经脊细胞的影响,了解Ubc9在神经嵴细胞中的功能,为相关出生缺陷生的预防和治疗提供理论依据。方法①采集备期鸡胚,通过免
《中导条约》是战略军备控制和国际安全领域的支柱性条约之一。2019年美国单方面退出《中导条约》,启动新一代中程导弹研发,并宣布将优先向亚太地区部署此类武器。美国的政策对国际安全秩序和中国安全环境构成了重大挑战。从政策动机角度考察,美国退出《中导条约》是为了更好地为本国军备发展解除国际约束、压制战略竞争对手、维持和拓展本国军工企业生存空间并稳固全球军事霸权手段的多样性和灵活性。这一仅以美国利益优先为
当今,气候的变暖及环境的恶化已成为人们广泛关注和亟待解决的问题,洪涝灾害作为一种常见且极端的自然灾害,对人类的危害尤为严重.广西因其特殊的亚热带季风气候和独特的喀斯