基于多标记学习的蛋白质亚细胞定位预测方法及其应用研究

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:cai8211306
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质在细胞中发挥的作用能够参与到生命体的生长、发育和繁殖等活动中。研究发现多标记蛋白质承载着更多的细胞功能,通过对多标记蛋白质亚细胞的定位研究能够帮助人们理解更多疾病的发病机制,为细胞疾病的预防和诊断提供参考信息,并揭示了多标记蛋白质在药物化合物等方面发挥的重要作用。面对多标记蛋白质数据逐渐增多,传统意义的研究方法已不能成为研究者们探索的主要手段。因此利用机器学习对多标记蛋白质亚细胞进行预测越来越重要。本文针对多标记学习的蛋白质亚细胞定位深入研究,研究内容如下:1.提出了一种基于Mps LDA-Pro SVM的多标记蛋白质亚细胞定位预测新方法。首先,利用四种编码算法伪氨基酸组成、三联体、基因本体和伪位置特异性得分矩阵挖掘序列中的特征并融合多种信息。其次,将融合后的特征信息首次采用基于熵权重形式的加权多标记线性判别分析法精炼和提纯特征信息。最后,将最优特征子集先使用多标记K近邻与具有标记特征的多标记学习算法得到相关标签的综合排名,再输入到基于支持向量机的预测和相关性排序(Pro SVM)分类器中预测其亚细胞位置。通过留一交叉验证进行测试,病毒,植物,革兰氏阳性菌和革兰氏阴性菌数据集的OAA值为98.06%、98.97%、99.81%和98.49%、比其他先进方法分别高0.56%-9.16%、1.07%-30.87%、0.21%-6.91%和3.99%-8.59%。通过对比,模型Mps LDA-Pro SVM可以有效预测细胞中多标记蛋白的特定位置。2.提出了一种基于多视图学习的多标记蛋白质亚细胞定位方法,称为Mpsmv RBRL。首先分别利用伪氨基酸组成、伪位置特异性得分矩阵、特异性得分矩阵-转移概率组合、二肽和基因本体算法从不同视图中提取数值信息。根据五种单特征提取方法的贡献值,首次使用差分进化算法学习单特征的权重,再将这些原始特征采用加权的方式融合多种信息。其次将融合后的高维特征使用基于二进制权重形式的加权多标记线性判别分析法去除不相关的信息。最后将最优特征向量输入到具有鲁棒性低秩学习的联合排名支持向量机和二进制相关性(RBRL)分类器中预测多标记蛋白质亚细胞的位置。经过留一交叉验证检验,Mpsmv RBRL在训练集革兰氏阳性菌数据集上的OAA值与OLA值均为99.81%。在测试集病毒、植物和革兰氏阴性菌数据集上的OAA值分别为98.55%、97.24%和98.20%,OLA值分别为97.62%、97.16%和98.28%。结果表明本文提出的模型达到了良好的预测性能,能够有效的预测多标记蛋白质亚细胞的位置。
其他文献
红木家具作为我国传统文化的载体,以其精美的造型和深厚的文化底蕴受到了许多国内外消费者的青睐。居住空间是红木家具的表现舞台,是满足人们物质和精神生活需要的空间环境,在人们的日常生活中扮演着重要的角色。随着人类科技的发展、中西方文化的交流和碰撞,人们的生活方式和审美意识都发生了深刻的变革,在国家提倡传统文化回归的背景下,具有传统文化精髓的红木家具融入现代居住空间还存在一定的挑战,如何让传统与现代擦除时
2020年初,在本应普天同庆的新年佳节里,一场突如其来的疫情使孩子们有了一个超长时间的寒假。为保障师生安全健康,教育部做出推迟开学的决定。各省市教育行政部门相继发出"停课不停学"的通知,湖南省教育厅致全省师生公开信要求确保"推迟开学不停学"。这意味着要通过教师的线上教学、孩子的居家学习来保障学生学业。据了解,孩子居家学习,随着时间一再延长,出现家长焦虑、亲子关系紧张,孩子对老师、父母的要求应
期刊
随着时代的发展,知识技术在企业中发挥的作用越来越大,同时技术更迭以及市场变化速度的加快使得企业面临的淘汰风险也加大,只有不断改善其内部的知识技术储备才能在时代的潮流中屹立不倒。但就单个企业而言,仅靠自身的资源整合能力全面地掌握利于自身发展的知识技术在根本上就存在局限性,这就需要企业发挥自身的关系网络,扩大其知识、人才以及资源获取的边界,因而嵌入关系网络是势在必行。关系网络聚集了诸多企业自身增值活动
大数据与云计算分析技术的飞速发展,为网购平台贴合消费者需求提供了无限的可能。网购平台搭乘科技快车的同时,消费者网络隐私事件也逐渐显现,因此也逐渐引起网络隐私研究领域的广泛关注。我国消费者在网购环境中所存在的隐私悖论现象,是消费者网络隐私安全的重要隐患所在,同时也会使消费者因隐私问题对网购平台产生消极评价,基于用户画像分析的营销措施也会由此失效,因此分析并解决网络隐私悖论问题,对形成消费者网购良好用
在中枢神经系统中,胆碱能调控是最重要的神经调控机制。神经递质乙酰胆碱(ACh)作用于其靶点毒蕈碱受体和烟碱受体实施胆碱能调控。烟碱受体又称尼古丁受体(nAChR),是以同聚体或异聚体形式存在,其中最丰富的同聚体是α7-nAChR,它是大脑(尤其是海马体)中主要的nAChR亚型之一。α7-nAChR属于五聚体配体门控离子通道超家族,它通过打开可渗透阳离子的内在通道对其激动剂(如Ach,choline
刺激响应水凝胶在软机器人、组织工程和致动器等方面具有潜在的应用,因此引起了人们的研究兴趣。目前,科研工作者已报道了大量的基于双层结构、梯度结构与图案化结构的刺激响应水凝胶。双层与梯度水凝胶只能发生简单的弯曲、屈曲等变形,而图案化结构虽然可以用于复杂3D形变水凝胶的构建,但是不同材料间的相容性较差,容易发生破坏/分层,且合成过程较为困难。对于自然界中的一些行为,现存刺激响应水凝胶仍难以对其进行模仿。
目的:通过临床观察影响糖尿病患者骨密度变化的因素,明确骨质疏松症的影响因素,以期做好对骨质疏松症的有效预防。方法:本次研究收集了2014年12月~2018年12月于我院接受体检且符合纳入和排除标准的550例2型糖尿病患者作为糖尿病组,同期选取院内接受体检相似年龄段及性别的530例健康体检者作为对照组,使用双能X线骨密度仪(美国诺兰德XR-46)对患者的骨密度进行测定,测定指标包括第2-4腰椎和股骨
真正的居家学习也许是伴随着孩子们成长的更长久的学习形态,它远比学校学习更久远,甚至会伴随大部分人的终身。这次新型冠状病毒的大爆发给全国人民的正常生活带来很大影响,当然也给学生的学习生活带来一定的影响。尽管教育行政部门、学校和老师们都做出了相应的努力,想尽办法通过提供线上的学习课程等多种方法帮助孩子居家学习。但是,学校老师很焦虑,家长很焦虑,学生也很焦虑,特别是面临中考或高考的孩子,担心在离开
期刊
天然染料作为合成染料的重要补充,其在纺织行业的地位随着消费者对绿色健康纺织品的高要求而日益提升。石榴皮为食品行业的副产物,富含多种花青素及具有生物活性的酚类物质,成为天然染料又一可靠来源。本文以废弃石榴皮为原料,在保证色素产率和生物活性的基础上,通过响应面分析优化超声波辅助提取色素工艺,并将石榴皮色素(PRD)用于羊毛纤维和阳离子改性天丝纤维的染色。相较于传统热浸提,超声波技术更适于PRD的提取。