林木基因组进化与膜转运蛋白识别方法研究

来源 :东北林业大学 | 被引量 : 0次 | 上传用户:vk2046
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代,生物信息学研究受到越来越多的关注,在生物信息学多个研究领域中,林木基因组是非常重要的研究方向之一。林木基因组在新一代高通量测序技术基础上,测序产生了海量的基因组数据信息。面对越来越多的基因数据,如何有效地从基因序列中收集信息,从而解决生物学问题是当前热门的研究方向。本文在林木基因组已有的研究基础上,从基因组数据库中获取到多种林木基因组数据,完成基因序列处理,序列数据的序列比对和多序列比对等,基于基因组序列数据信息进行林木物种系统发育学研究,分析林木基因组的进化过程。本文的主要研究内容包括:(1)在当今林木基因组和系统发育研究基础上,从NCBI、Plant GDB、Pla Bi Database等常用的林木基因组数据库中,获取35种林木的基因组数据。统计和分析了基因组数据序列检测、序列比对等数据处理方法,采用基因数据处理方法对林木基因组数据进行处理,使用系统发育学方法研究林木基因组数据,根据多序列比对结果构建系统发育树,在遗传距离和同源性分析基础上研究林木基因组进化过程。(2)通过基因组研究分析了林木基因组进化差异。基因序列的差异表达会改变蛋白质功能结构,通过分析蛋白质序列差异研究基因序列差异以及基因组进化过程。本文提出了一种林木膜转运蛋白质识别方法FMP-SVM,提取蛋白序列的位置特异性矩阵,并从中获取特征数据,对特征数据进行处理,使用SVM-RFE-CBR算法对特征降维,选出最优特征子集,特征数据子集用于训练构建蛋白识别模型,并进行独立测试模型评估。本方法相较于其它分类方法,能有效地识别林木膜转运蛋白质。(3)在林木基因组研究的基础上搭建了林木基因组浏览器,用于林木基因组数据的管理与可视化,实现了基因组序列、基因组信息、序列比对结果等基因组信息的可视化,实现了可视化分析林木基因组信息,研究林木基因组进化。综上所述,本文主要通过系统发育学方法研究林木基因组进化间差异,分析林木基因组进化关系。提出了一种林木膜转运蛋白识别方法,基于蛋白差异分析基因序列差异,研究林木基因组进化。在以上研究基础上,搭建了林木基因组浏览器,展示基因组信息,可视化比较林木基因组进化间差异信息。
其他文献
随着我国的飞速发展,尤其是改革开放以来国家城镇化、工业化的腾飞,土地作为最为重要的生产资料已经成为极为稀缺的资源。城市的飞速发展离不开土地的供给,为了给城市发展供给土地,大量农村集体土地被征收,在这个过程中,出现了很多失地农民,属地政府建设了拆迁安置用房对他们予以安置。对这一类型的社区进行针对性的治理,对于保障失地农民的生活水平有积极的作用,同时能够帮助失地农民更好的融入城市社会,保障基层社会的和
学位
进入21世纪后,牦牛种质分子特性研究成为牦牛科学研究的热点,取得了许多新成果。该文以近年来的研究成果为主线,综合分析了牦牛种质资源的现状与特点、研究进展以及研究和开发利用中存在的问题,并探讨了其对策和措施,以便为今后合理开发利用牦牛种质资源提供理论依据。
期刊
用户对于公共事件、消费产品等的讨论文本蕴含着许多与用户立场相关的信息,这些信息能够辅助用户群体划分、商品推荐等任务,并且有助于政府、企业等部门把握社会事件中的公众舆情。因此,面向社会媒体的文本立场检测具有重要的意义。目前,在文本立场检测领域,研究者提出了许多有效的研究方法,其中大部分方法使用的是传统的机器学习、主题模型和深度学习方法。同时,在自然语言处理领域中,预训练语言模型在包括文本立场检测工作
学位
随着能源的不断枯竭、生态环境的不断恶化,发展和培育新能源汽车成为我国应对气候变化、解决环境污染和能源安全多重问题的重要途径之一,也是推动绿色发展的关键举措。技术创新是提高产业竞争力的重要源泉,但新能源汽车产业尚未步入成熟阶段,存在创新意识薄弱、创新水平不足的问题,因此还无法完全依赖市场机制提升国际竞争力,从而实现“弯道超车”。政府作为“另一只手”,如何有效发挥引导、规制作用,促进新能源上下游企业合
学位
作为国民经济的重要支柱性产业,建筑业的发展却一直受到频发的安全事故的困扰。已有研究与实践表明,工人的不安全行为是引发事故的重要原因之一。安全领导力对于工人的安全行为具有非常重要的影响作用,但目前对于建筑企业基层管理者安全领导力的研究较为匮乏。由于基层管理者身处施工一线,其能够与工人直接、频繁地接触,基层管理者安全领导力对于工人安全行为的影响较为直接且效果显著,但目前对于其影响机理缺乏清晰而系统的认
学位
准确及时的虫情检测是农林业虫情监控的关键技术。传统虫害检测主要依靠人工方式对害虫识别和计数,这种方式费力耗时且易出错,难以满足实际应用需求。近年来,国内外研究者在害虫检测方法上进行了大量研究,其中,基于深度学习的图像处理方法在模型精度和泛化能力上都大幅超越了传统机器视觉方法,在害虫图像检测问题中表现出较强的鲁棒性,但依然存在以下问题:对于复杂自然背景环境下形态各异、密集堆叠且自身颜色与背景相似的害
学位
随着线上购物的飞速发展,不少制造商在线下直销的渠道之外构建了线上直销渠道与第三方线上零售商展开竞争,同时第三方线上零售商通过大量发放优惠券吸引消费者,从而在竞争中取得一定优势。然而,第三方线上零售商通过规则复杂的促销活动来发放线上优惠券给消费者带来了额外的消费成本,使整个供应链的效用受到了影响。因此,研究考虑线上优惠券促销活动下的混合渠道供应链,探讨制造商与第三方线上零售商的定价与营销决策之间的相
学位
由于世界各国环境恶化与资源匮乏问题日益突出,许多国家和地区开始反思问题根源,并出台相关政策确保生态环保落实到位,从而有效减少资源浪费、保护环境。为响应政策要求,相关制造型企业通过投资产品绿色技术、设备等以提高企业产品绿色水平,使自身利润提升的同时,又能提供消费者高绿色水平产品。但在此过程中,又加大了制造企业及其零售商的风险,如研发风险、市场需求风险等。除此之外,随着互联网购物的快速发展,消费模式也
学位
随着“低碳经济”理念的深入,消费者的环保观念逐步增强,并产生参考低碳水平效应进而影响企业的减排行为。在供应链体系中,由于环境的复杂性和对碳减排认知的偏差,供应链成员的互惠利他偏好也会影响企业的减排行为。在二者的影响下,企业在采取各种方式进行减排的同时,往往会利用自身优势将难以完成的碳排放转移给供应链上下游企业,以实现自身利益最大化。实践中,供应链企业间碳排放转移的产生不仅使得企业减排责任难以准确界
学位
DNA甲基化是指DNA序列的特定碱基在DNA甲基转移酶的催化作用下通过共价键结合一个甲基基团的化学修饰过程。DNA N4-甲基胞嘧啶(4mC)和DNA N6-甲基腺嘌呤(6mA)是DNA甲基化的两种表现形式,它们会影响哺乳动物的生长发育,但具体机制尚不明确。因此,准确地检测它们在基因组的位置对深入了解其形成机制和功能作用至关重要。传统湿实验和高通量测序技术成本高、耗费时间长,难以应对爆炸性增长的基
学位