【摘 要】
:
认识理解蛋白质结构与功能,对推动生命科学、农业、医疗等领域具有重要的现实意义。蛋白质二级结构预测是蛋白质结构研究的重要环节,利用机器学习对携带有进化信息的位置特异性得分矩阵(PSSM)预测蛋白质二级结构,是生物信息学领域的重要手段。为降低对高质量标注数据的依赖,探索半监督学习对蛋白质序列数据的挖掘,实现二级结构的预测研究,是具有重要的信息学和生物学意义。这类算法的核心是充分挖掘未标注数据的有用信息
论文部分内容阅读
认识理解蛋白质结构与功能,对推动生命科学、农业、医疗等领域具有重要的现实意义。蛋白质二级结构预测是蛋白质结构研究的重要环节,利用机器学习对携带有进化信息的位置特异性得分矩阵(PSSM)预测蛋白质二级结构,是生物信息学领域的重要手段。为降低对高质量标注数据的依赖,探索半监督学习对蛋白质序列数据的挖掘,实现二级结构的预测研究,是具有重要的信息学和生物学意义。这类算法的核心是充分挖掘未标注数据的有用信息,并与有标注数据形成高效融合。同时,设计恰当的特征工程方法也将有效提升二级结构的识别性能。本文就该问题开展以下几方面的工作:1.针对位置特异性得分矩阵,设计有效的特征表示方法。也即考虑不同蛋白质氨基酸的进化信息、相邻残基和非相邻残基间的信息,设计多种基于PSSM的特征表示方法,映射(或变换)生成具有较强判别能力的数值特征向量。2.针对特征表示所生成的高维特征向量,考查特征选择在二级结构预测中的作用。也即基于统计信息的过滤法,消除在特征表示过程中产生的冗余和不相关特征,实验比较其对半监督学习性能的影响。3.介绍多种经典的半监督学习算法,尝试将基于阶梯网络的半监督模型应用于蛋白质二级结构预测,并作比较分析。阶梯网络半监督模型是一种融合有监督与无监督模型各自的特点,通过基于降噪机制之上搭建编码器与解码器的沟通“桥梁”,从而实现半监督学习的模型。4.实现实验与比较,对D8244与D640数据集以及三种不同类标比率分组设计,证实在外界条件相同的情况下,阶梯网络半监督模型准确率优于其他经典的半监督模型;另外,优化组合模型参数与特征表示,在条件相同的情况下,将所得模型与传统SVM和RF做比较,发现其性能逐步接近有监督的算法。所研究基于阶梯网络的半监督学习算法在蛋白质二级结构识别中具有一定的实用性,并且前期特征工程能够提升模型性能。因此本文所提方法能够被应用于蛋白质二级结构预测,所研究方法对数据挖掘方法与生物学科学前沿问题的结合研究也有着信息学与生物学意义。
其他文献
为解决旅游发展带来的日益严重的景区环境问题,各大景区纷纷呼吁旅游者在景区内实施环境友好行为,学者们也积极投入到旅游者环境友好行为的相关研究当中。梳理相关文献发现,完善景区内环境教育相关设施,开展相关环境教育主题活动,有助于游客环境友好行为意愿的产生。高中生旅游者是景区环境教育主题活动的重要参与者,揭示高中生旅游者环境教育感知与环境友好行为意愿的内在的关联,将有助于找出提升景区环境教育效果和引导高中
中国共产党的形象塑造研究,对于巩固党执政地位的长期性具有重要现实意义,关乎群众对党的信任程度和拥护程度,关乎党的合法执政基础。中国共产党自革命时期就十分重视自身形象塑造问题。中央苏区时期是中国共产党作为局部执政党,争取群众对中共的价值认同和情感认同的重要时期,在这一时期中国共产党通过自身的行动和强大的政治宣传在中央苏区民众心中成功塑造了良好的革命形象、民主形象、廉洁形象和先进形象。《红色中华》作为
人类对历史的认识是学术界致力于探索的理论问题,也是关乎人类自身,国家以及整个社会发展的现实问题。最早之前人类对历史认识的成果是历史循环论以及历史退步论,中世纪以来,历史进步观念逐步发展并为大众所接受。资本主义在发展呈现欣欣向荣景象的时候基本矛盾开始周期性爆发,已有的历史哲学在解答这些问题面前显得软弱无力,一种新的历史观念成为时代的迫切需要。此时,马克思的历史进步思想应运而生并逐渐发展成为占主流地位
随着新课标的实施以及素质教育理念的不断推行,目前多媒体手段进入课堂已经是常态,其中视频资源是非常重要的课程资源,视频教学已经成为了一种普遍的教学手段。如今新课改对培养学生地理核心素养的呼吁,也给教师的教学带来了新的挑战。短视频辅助教学作为一种简洁高效的教学手段,其来源丰富、内容广泛,在培养学生的地理核心素养方面也将发挥越来越重要的作用。本研究在总结前人研究成果的基础上,以研究在地理教学中,如何适当
社会活动纷繁复杂,随着经济的发展,人们养老观念的转变,养老机构违反安全保障义务的纠纷日益增多,而法律固有的滞后性导致现有制度难以应对现实中不断出现的新问题,其中之一就是养老机构安全保障义务的合理限度问题。依据《侵权责任法》第37条、《最高人民法院关于审理人身损害赔偿案件适用法律若干问题的解释》第6条仅能明确养老机构应当负有安全保障义务,而对于其成立具有关键作用的合理限度却仅做了抽象规定,并未涉及养
按照考试大纲的要求,文科综合能力测试的Ⅰ级考核目标为获取和解读信息的能力。获取和解读信息是考生解答问题的前提。通过对近几年高考试题的分析,我们可以发现,试题信息有的蕴藏在背景材料的文字中,有的蕴藏在背景材料的图形图表中,
现代漆艺在发展过程中不仅吸收了传统技法使用了传统材料,还产生了许多新的技法与材料,不同材料与多种技法的互相碰撞,丰富了现代漆艺的艺术表现形式,无论是漆画、漆器还是漆塑的表现方式都不局限于过去,其中新产生的漆艺髹饰技法就有稀释剂起纹。本文以稀释剂起纹在漆艺中的应用作为研究对象并结合个人实践经验,主要从以下几个问题阐述:第一、稀释剂起纹的基本概述。文章通过对稀释剂起纹的定义与种类进行概述,总结不同稀释
随着漆画史的演进,越来越多的漆画创作者开始探索属于自己的艺术语言。具象表现已经无法满足他们的创作欲,漆画家们日益倾向于抽象图式的创作。抽象图式在漆画中的运用,彻底从对具体形象的模仿再现中抽离出,使漆画创作者更自由地表达精神内涵,表现形式也更加丰富生动,为漆画创作提供了更多的可能性,是一种独具审美价值的图式语言。本文正文共分为四大章。第一章从宏观角度对抽象图式的相关概念进行阐释,并对抽象图式在漆画中
赛伯朋克艺术是在上世纪中叶开始流行于西方的艺术流派。赛伯朋克艺术风格的视觉样式被广泛运用于服装服饰、电影电视和艺术设计的领域。新奇的表现形式以及探寻未来的设计理念都很值得借鉴。本文第一部分从赛伯朋克艺术的早期状态,到逐渐发展形成影视动画和其他多种艺术形式,归纳总结出赛伯朋克艺术风格的视觉图像设计创作趋向,以及赛伯朋克艺术风格对未来视觉图像设计创作的开拓性。进而选取了几个典型案例分析当下赛伯朋克艺术
保尔·西涅克是19世纪法国新印象派的代表画家之一,他以海洋为绘画对象,一生都在描绘法国各大港口的自然风光。西涅克秉承着客观科学的态度表现一切,他以点描笔触画成作品,将海洋的瞬息万变呈现给观众。西涅克打从心底热爱海洋,尊重大海赐给人类的一切美好景象,包括七彩斑斓的阳光和瞬息万变的天气。正是因为西涅克对自然界的光色有着不懈追求,使他能将自身对海洋的理解和内心对于海洋的情怀表达出来,使作品饱含了远超表层