拟南芥抗旱蛋白分类方法研究与平台构建

来源 :东北林业大学 | 被引量 : 0次 | 上传用户:sky_fly_sk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着气候的不规律变化和生态环境的破坏,干旱对农林业生产的影响越来越大。通过栽培抗旱的植物种类,合理利用旱田发展潜力巨大。拟南芥是植物遗传学、发育生物学、分子遗传学的研究的好材料,被誉为植物中的果蝇,因此在植物抗旱领域的研究里,拟南芥发挥着重要的作用。目前研究者们开展了大规模研究用以推断不同基因对植株耐旱功能的影响,并采用各种方法培育具备耐旱能力的植株。其中包括推测蛋白质是否具备耐旱的功能,以此帮助研究者合成具有相关功能的蛋白质,完成植物耐旱的物种改良。序列检测技术的蓬勃发展使测序生产成本大幅下降,测序速度急剧提高,与此同时,蛋白质数据的收集和处理技术也越来越成熟和多样。但是由于网络上蛋白质数据库的使用步骤繁杂,下载的数据需要进行处理后才能使用,以及缺乏分析和可视化这些数据的工具,使得大部分蛋白质数据的有效信息没有得到充分利用。针对上述问题,本文主要工作包括:首先,提出了一种用于蛋白质分类的自动特征选择算法(简称为AFS-DEA),它主要集成多分类器,采用自适应的方式从基分类器列表中选取相应的基分类模型,使用多轮重采样、基分类器的训练、计算分类准确性的组合方式来计算变量重要性分数,运用聚类方法选出重要的变量。该算法相比于单一分类器准确性高。模拟和真实数据实验证明了该算法的优越性。然后,以拟南芥抗旱蛋白为研究对象,利用自动特征选择算法计算特征重要性,按照特征重要性降序对特征进行逐维增加的迭代计算。最终找出使拟南芥蛋白质表现出抗旱特性的16个关键特征以及对于区分抗旱性有帮助的两种氨基酸性质,并借助这些特征对拟南芥抗旱蛋白质进行分类。最后,面向生物数据的研究过程,秉持美观以及实用性的页面设计理念,基于Django框架和Scrapy框架,集成数据获取、数据处理、特征选择等技术,开发出一个集数据获取-数据处理-特征选择-特征验证为一体的蛋白质研究平台。使用该平台完成了拟南芥抗旱蛋白分类的研究。
其他文献
2013年德国政府提出“工业4.0”战略,并且在汉诺威工业博览会正式推出,这标志着最新一轮工业革命的开端,该战略旨在利用信息化技术提升制造业的智能化水平。两年后中国提出《中国制造2025》战略,其中的两项主要战略任务为:推进两化(信息化与工业化)深度融合,全面推行绿色制造。调度作为制造业中重要环节,对调度能耗水平进行优化是响应绿色调度的一种重要方式。此外,结合企业不同产品在不同机器中加工效率不同的
学位
文本分类是自然语言处理领域的重要分支,近年来吸引了众多科研工作者的关注。由于文本数据易于编辑等特点,网络中大部分文本是由用户手动构建并上传。因此,对网络文本的规范化处理并进行不同粒度的文本分类对信息检索领域有着至关重要的意义。传统的文本分类是将文本作为序列化的信息来进行处理,使用一条文本中前面的序列预测后面的序列、通过中心词对上下文进行预测等方式,使分类器在继承旧序列信息的同时学习新序列的知识,从
学位
随着我国住房工业化进程的加快,以及国家有关政策的支持,装配式的建筑模式成为必然。但是,各领域对装配式建筑的质量所存在的诸多问题仍持保留态度。多种装配式建筑质量问题层出不穷,说明了装配式建筑模式的总体运行效率低、质量难以得到保障。其中既有行业自身的原因又有供应链方面的原因。由于装配式建筑具有多级性和分散性等特点,这使得装配式建筑的质量管理面临着巨大挑战。由于供应链模式的运用使得最终的装配式建筑必须由
学位
随着经济的不断发展和技术的创新突破,产品更新换代速度加快,在闭环供应链中开展以旧换新业务已经成为回收废旧产品的新模式。以旧换新既可以促进环境的可持续发展,又可以刺激需求,推动产品换代升级,受到企业和消费者的广泛关注,在近年的购物促销活动中,制造企业纷纷推出以旧换新业务,例如华为、OPPO、Apple等。制造企业开展以旧换新业务受到市场环境、产品种类和回收渠道等因素的影响,因此,如何对以旧换新业务进
学位
行人重识别的目的是识别多个摄像机下具有指定身份的行人图像。目前,基于监督学习的行人重识别方法已取得了优异的性能。然而,该类方法严重依赖于带标注的数据。基于以上问题,大量研究者开始将注意力转向无监督行人重识别领域。依据是否使用源域数据,现有无监督学习方法可以被分为跨域方法和完全无监督方法。本文分别对以上两种方法中存在的问题进行了研究,主要研究内容如下:(1)对近年来国内外的相关研究进行了详细梳理和分
学位
玉米作为全国乃至全世界最主要的粮食作物之一,在食用、饲料用途、工业加工等方面发挥着重要的作用。近年来,随着全球气候异常以及玉米品种更换等原因,玉米叶部发生病害的现象明显增多,这给玉米的生产带来了极大危害。常见的玉米叶片病害有十几种,其中以大斑病,灰斑病与锈病为主。传统的玉米叶片病害分类主要靠工作人员肉眼观察的方式,然而该方法不仅判定效率低下,而且往往受主观因素制约。因此,有必要寻觅出一种高效且精准
学位
冬小麦是山东省嘉祥县种植面积最大的粮食作物,由于多年的秸秆还田,土壤以旋耕为主,小麦病虫害逐年增多,对小麦的危害越来越严重。小麦发生病虫害后施药防治效果较差,药物残留对环境造成一定程度的污染,既浪费大量的人力和物力,又严重制约了小麦优质丰产。小麦种衣剂的推广应用成为防治小麦病虫害的关键措施之一,2020—2021年嘉祥县农业技术推广服务中心联合嘉祥种衣剂经销商在冬小麦生产中进行了对比应用试验,选用
期刊
供应链协调旨在通过契约形式,加强供应链合作关系并改善供应链绩效。随着交易成员的增加,“公司+农户”供应链由传统链式结构向网络化结构转变,这增加了协调的难度。同时,现有契约在商业实践中协调效果有限,导致“公司+农户”供应链协调失败。究其原因主要为:一是现有研究尚未形成有关协调契约结构的系统性理论框架,难以指导“公司+农户”供应链契约方案制定。二是现有解析模型难以刻画多决策者构成的“公司+农户”供应链
学位
森林资源是陆地生态系统中的一个重要组成部分,为人类的生产和生活提供了赖以生存的氧气以及丰富的木材原料,属于可更新可再生的自然资源。因此,快速、准确地获取测树因子(如树高、胸径、冠幅等)一直以来都是森林资源调查的基本工作。目前森林资源调查的主要方式中,人工调查周期长效率低,通常以年为周期;卫星遥感信息量大,更适合大尺度范围内的调查;激光雷达精度高可视效果好,但价格昂贵,难以被广泛应用。随着计算机视觉
学位
太阳能是一种清洁、可靠的可再生能源,已引起国内外学者的广泛关注。在众多的太阳能利用技术当中,光伏(PV)技术特别引人注目,通过使用光伏电池将太阳能直接转化成电能,但与传统发电技术相比,较高的初始成本仍然是其大规模发展的阻碍。聚光光伏(CPV)技术能有效地降低光伏发电成本而被寄予厚望。然而,聚光条件下电池温度急剧升高使得转换效率下降,成为制约该技术推广应用的主要瓶颈。针对聚光光伏传统冷却技术的不足,
学位