【摘 要】
:
亚细胞定位是蛋白质组学的重要研究内容,与其功能、代谢等生物过程密切相关,对药物发现、疾病诊断等方面的研究具有重要作用。基于机器学习的计算方法是一种高效的亚细胞定位
论文部分内容阅读
亚细胞定位是蛋白质组学的重要研究内容,与其功能、代谢等生物过程密切相关,对药物发现、疾病诊断等方面的研究具有重要作用。基于机器学习的计算方法是一种高效的亚细胞定位预测方法,但是机器学习方法需要大量的训练数据才能取得较高的预测精度,而亚细胞定位预测中用于训练的实验数据较少,尤其多定位点蛋白质试验数据的缺乏更加明显。本文针对亚细胞定位预测中多定位点蛋白质训练数据的缺乏而导致预测效果不理想的情况,将直推学习技术引入亚细胞定位预测问题中,提出一种新的直推亚细胞定位方法。本文的直推方法可以同时处理单定位点和多定位点蛋白质,并在训练过程中充分利用了测试集中样本的特征信息,通过计算全部样本间的相似关系,直接在测试集上进行推断,最终得到测试集的亚细胞定位信息。本文选择在人类、植物和病毒三个物种数据集上进行实验验证算法的有效性。通过与当前相关算法的比较表明,本文方法可以在不降低蛋白质亚细胞整体预测精度的基础上有效的提高了多定位点蛋白质的预测效果。
其他文献
铁路大型养路机械(简称“大机”)是维护铁路线路正常运行的关键设备,它融合了机械、机电一体化和自动控制等学科的专门知识和技术。大机间防撞的传统方法是进行人工通话,此方
今天的中国户外运动日益普及,通过采用电子设备提高户外运动的安全性是常见的手段。目前国内户外运动,获知自身位置、周边地理信息主要依靠手持式GPS设备,保持队友间通信主要
相变现象在自然界中普遍存在,在计算机科学和人工智能领域也是如此。现有的研究表明,相变的发生与求解问题的解的结构有着密切的关系。因此对相变现象进行研究的意义在于,其
目前我国的主要油田都进入了高含水期开采阶段,需要采用各种挖潜措施和技术手段,来提高最终采收率,保障油田稳产。过套管地层电阻率测井是国外近几年发展起来的确定剩余油饱
MAC(Media Access Control)协议决定信道接入方式,为网络内密集分布的节点建立互相通信的数据链路,将有限的无线信道资源分配给网络中的传感器节点。MAC协议的服务质量的高低
非线性系统普遍存在,不确定性是无法避免的,而时滞又是一般系统所具有。本文以非线性不确定时滞系统为研究对象,借助多项式平方和(Sum of Squares,SOS)理论,直接使用非线性的
在新型功率半导体器件的推动下,开关电源技术取得了突破性的进展,正因如此,其应用的场合也愈加广泛,人们对开关电源的要求也越来越严格,电源设备正朝着高效率、轻量化的方向发展。电源的轻量化要通过提高开关频率来实现,开关频率的提高会造成效率的下降,现有的电源设备也存在功率因数低污染电网的问题,所以优质的AC/DC变换技术成为一个新的研究热点。为了实现绿色用电和高效用电,本文提出两级AC/DC变换结构,前级
随着工业自动化水平的提高,如何利用实际运行的数据对系统的性能进行评价成为人们日益关心的问题。Harris最早提出利用最小方差基准来评价单输入单输出(SISO)系统的性能。对
船舶运动控制问题是控制领域的研究热点,从事该项研究的专家学者日趋增多。但是由于船舶运动模型的复杂性,研究人员不得不花费大量时间在船舶建模、仿真等重复性工作上。这严
光突发交换技术因其具有高带宽利用率、传输效率高、应用范围宽、构建设计简便等优点,成为当今光交换领域最有价值的技术之一。目前关于光突发交换网络方面的研究大部分都是