甘蔗割手密种基因组数据库的构建

来源 :福建农林大学 | 被引量 : 1次 | 上传用户:xiaofengwuxuan123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
甘蔗(Saccharum spp.)是世界上最重要糖料、生物燃料作物,是研究C4光合作用途径和同源多倍体遗传的模式植物,具有巨大的经济和科研价值。在过去的数年中,甘蔗的测序及分析数据迅速积累,为本研究的顺利开展奠定了基础。使用Tripal工具构建甘蔗割手密基因组数据库(http://www.sugarcanetf.site/sgd/html/index.html)作为甘蔗研究的中心门户对这些数据进行存储、挖掘、分析、整合以及共享。研究主要结果如下:(1)甘蔗割手密基因组数据的开发使用BLAST2GO和EggNOG,对甘蔗中99,708个基因进行GO项目注释,65,277个基因进行KEGG生物通路注释。对甘蔗割手密预测基因中的1,278个特异性基因家族进行GO富集,发现这些基因的功能大多富集在对伤口、外部刺激的反应。使用MISA软件对甘蔗割手密进行全基因组SSR开发,共发现577,299个SSR位点,其中染色体特异性位点有98,271个,约占总数的17%。将其与其他四种禾本科植物中的基因组SSR进行比较,发现在禾本科植物中,SSR的丰度与其基因组大小成正比,而SSR的相对丰度与基因组大小没有明显的相关性。开发植物全基因组转录因子预测分类流程,调用HMMER软件实现甘蔗割手密的全基因组转录因子预测及分类。研究中共预测到4,271个编码转录因子的基因,并将其分为57个转录因子家族。(2)甘蔗割手密转录组表达谱数据的开发使用HISAT2和Cufflinks对甘蔗割手密叶段发育、不同生长时期以及昼夜节律的材料进行表达量计算,所得数据可以为甘蔗碳水化合物、光合途径等重要生物学性状基因家族表达谱的研究提供帮助。(3)甘蔗割手密重测序群体基因组数据的开发使用GATK进行变异检测,共识别出448万个高质量的变异型,其中包括约390万个SNPs。之后分别使用SNPhylo和Admixture软件进行系统演化分析和群体结构分析。群体结构分析结果表明可将甘蔗割手密群体分为三个亚群,三个亚群中染色体倍性均呈广泛分布状态。所得数据可用于甘蔗割手密自然群体遗传背景的研究,并为甘蔗育种过程中割手密资源的利用提供帮助。(4)甘蔗割手密基因组数据库的构建基于上述数据集,本研究创建了国际上第一个甘蔗割手密全基因组数据库(Saccharum Genome Database,SGD)。SGD是一个用户友好型的交互式数据库,提供的数据集包括:基因组、蛋白序列、功能注释、表达量、转录因子、分子标记等。除了优质的数据集,SGD还为用户提供了详细的用户手册、强大的搜索工具以及实用的在线工具:JBrowse和BLAST。SGD网站将不断进行数据更新以促进甘蔗及其近缘物种的分子生物学、功能基因组学和遗传进化的研究。
其他文献
随着人们对电力能源需求的不断增加,越来越多的研究者开始关注智能电网,致力于建设一个更加高效、经济、稳定、环保、安全的新型电力网络结构。然而智能电网中不同场景下对智
经验证明,农业用地的适度集中可以促进并合理调整农村产业化结构,增加农民收入,加速农村经济发展,然而面对当前“分田到户”后农用地零碎化的现状,以及当前土地适度集中方式
本文以美国作家兰波·罗威尔的小说《追星女孩》的汉译为例,探讨功能对等理论在小说文本汉译中的运用。原文带着作者强烈的个人色彩,语言精炼,风趣幽默,翻译起来有一定的难度
视频与图像是人们获取目标外观、色彩等特征的重要信息源。如何使机器能够像人类一样自主的感知、获取目标并对相应视频或图像的内容进行解析,是计算机视觉的重要研究方向。目标跟踪作为计算机视觉相关领域中的一个重要研究课题,与智能交通、自动控制等应用场景密切相关,用于使系统长期稳定的捕获相应目标。良好的目标跟踪算法需要有效的目标外观模型、完善的理论基础以及高效的求解方法。目前研究文献表明,研究人员在目标跟踪领
近年来,随着中国“引进来”和“走出去”文化战略的提出,国际文化交流日益频繁,越来越多的国外影视作品涌入中国。因此影视作品字幕翻译的质量也越来越受到重视。翻译实践报
田獵是先民們獲得生産生活資料的重要方法之一,不僅捕捉獸類,更兼捕獲魚類。田獵動詞作為表示捕獲禽獸意義的動詞,有必要對其進行斷代研究。從歷史學的角度來看,殷商—西周時
可展曲面是一类可以经过展开变换为平面的曲面。存在一个3D空间折纸模型,该模型沿折痕曲线展开,最终能展开成一个平面,则该折纸模型为可展曲面折纸模型。可展曲面折纸模型的
显著性检测是计算机视觉领域的核心内容之一,有着广阔的研究前景和应用空间。从1998年显著性检测的概念被提出到现在,已产生了很多有效的算法。基于数据驱动(自底向上)的显著性检测算法大都是根据数据集中图像的特点,将像素间的对比度作为像素的显著性。这类算法不需要预先训练,而且算法一般速度都比较快,处理有规律的图像数据集时有较高的准确率。与之相对的任务驱动(自顶向下)的显著性检测算法需要大量的数据集和时间
课堂教学语言是教师在课堂教学中向学生传递信息的核心手段,课堂教学要顺利地开展,有效地进行师生间信息的传递、情感的交流和沟通,完成教学任务,实现教学目标,很大程度上取
自上世纪我国住房体制改革以来,城市住区建设方兴未艾。经过几十年实践与发展,封闭社区逐渐成为城市居住形态主要形式之一。但关于如何从城市众多居住社区中识别和界定封闭社