蛋白质功能预测的半监督学习算法研究

来源 :福建农林大学 | 被引量 : 0次 | 上传用户:ydaf4rx3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质作为生命物质的基础,与生物体的生长息息相关。作为蛋白质组学的研究热点之一,研究蛋白质的功能有助于人类揭示生命的奥秘。虽然采用生化实验是最具生物学可靠性的分析蛋白质功能的方法,然而这类实验的周期长、成本高,已经无法满足处理目前高速增长的蛋白质数据的需要。这促使研究者们通过计算技术对蛋白质功能进行预测。随着高通量生物技术的发展,采用蛋白质相互作用网络的功能预测成为了近年来的研究热点之一。由于相互作用网络结构复杂,研究者们通常采用机器学习的方式对其进行分析。本文基于一种称为全局优化模型的半监督学习方式,采用蛋白质相互作用网络进行蛋白质功能预测。根据全局优化模型存在的对局部信息利用不足的问题,本文对其进行了改进,并提出了局部搜索策略引导的全局优化模型。基于以上模型,本文分别设计和实现了蛋白质功能预测的蚁群优化算法和蛋白质功能预测的混洗蛙跳算法。为了进行算法仿真,本文对目前常见的蛋白质相互作用数据库和功能注释数据库中的数据进行了收集和整理,针对其中蛋白质编号方式不同的问题设计和实现了一个数据预处理和整合工具,方便今后研究中的数据处理和交换。在算法仿真中本文采用了两组仿真数据,一组来自文献中提供的数据,另一组是本文采用上述工具将DIP-core与FunCat2.1的数据进行整合得到的数据。仿真结果表明,以上两种算法均能够有效对蛋白质功能进行预测,预测准确率总体高于现有的一些算法。另外,本文测试了上述两个算法对相互作用网络中假阳性、假阴性数据的容错能力,结果表明,上述两个算法均具有较好的容错能力。在进一步的分析中,本文在相同能量函数调用次数下比较了全局优化模型和局部启发式搜索策略引导的全局优化模型下算法的收敛速度,结果表明后者的收敛速度显著高于前者。
其他文献
  本文主要阐述了殡葬服务标准化建设的意义、殡葬服务标准化试点建设的进展情况和殡葬服务标准化试点建设的内容。
1.我们优秀全国社科类一级期刊、双十佳期刊、优势广告经营单位、中国广告精投奖、广告主广告商青睐的中国报刊。2.我们有影响力国内外公开发行,覆盖中国所有县级城市,单期发
  企业标准是为了解决产品设计、生产以及服务过程中出现的某一具体问题而确立的解决方案。企业标准具有技术积累和技术指令两项功能。由于高科技的发展,先进企业刻意比照标
欧拉两相流模型经常用于分析气固流动系统。在本工作中,首先进行了关联长度的分析,使用一般曳力(如Wen-Yu曳力)的双流体模型定量分析了气固系统的特征关联长度。结果表明,不论颗粒
  上海国检局长期以来都致力于对进境动物源性食品检验检疫工作流程的标准化建立工作。经过多年的努力已经基本建立了一套与符合上海口岸检验检疫工作特点的标准化工作流程
过渡金属氧化物/氢氧化物(如Ni,Co,Mn等)具有低成本、资源丰富、优异的法拉第电容性能、稳定的循环性能、以及良好的耐腐蚀性等优点,被认为是最有前景的电极材料之一。但由于金属氧化物/氢氧化物本身具有较差的导电性能,从而限制了其在电化学体系的实际应用较差的活性材料利用率,阻碍了其商业化进程。因此,研究者们对过渡金属化合物进行了多方面的研究,包括对形态结构、颗粒尺寸、组成成分以及微观结构等方面进行有
2009年12月,陈东征理事长、宋丽萍总经理一行调研走访了上海、江苏部分拟上市企业,并召开座谈会,就中小企业和科技企业如何更好地利用资本市场平台进行了广泛深入的交流。 I
本研究利用生物信息学拼接软件Velvet和Codoncode Aligner对草菇V23-8线粒体基因组的测序reads数据进行了组装拼接。组装结果得到五个片段,分别为contig4, contig5v, conti3,
学位
  认证行业的“体系认证产品化、产品认证体系化”的发展趋势,说明管理方式要精细化、管理工具要现代化、管理思维要多元化;产品发展的系列化、规模化、多样化趋势,要求认证模