籼稻珍汕97和明恢63基因组测序数据处理平台构建

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:alimamaai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水稻不仅是重要的粮食作物,也是植物研究的模式物种。目前已有粳稻日本晴(Oryza sativaL.ssp.japonica cv.Nipponbare)、籼稻9311(Oryza sativa L.ssp indica cv 9311)以及非洲稻(Oryza glaberrima)基因组序列发表,其中日本晴可以作为粳稻研究的参考基因组,而籼稻研究却没有高质量的参考基因组。利用珍汕 97(Zhenshan97,ZS97)和明恢 63(Minghui63,MH63)的 BAC(Bacterial Artificial Chromosome,BAC)文库数据和物理图谱数据,运用对大片段克隆分别测序的策略,借助第三代测序平台PacBio RS Ⅱ分别对它们的所有Minimum Tiling Path(MTP)BAC克隆进行了测序,最后组装得到ZS97和MH63的基因组。为了高效、系统、方便的管理BAC文库、物理图谱、测序数据等,本研究建立了测序数据管理分析平台,并且在管理平台上对数据进行了处理,具体如下:1)开发了一个实验室信息管理系统(Laboratory Information Management System),所有的BAC文库数据和物理图谱数据都储存于后台MySQL数据库中。在此平台上,postHGAP是一个重要的功能工具,它用于对一个由HGAP组装产生的Unitig序列进行去载体、环化等处理,并将所得序列与BAC Id进行关联的工具。从ZS97的物理图谱中挑选了 4,714个BAC进行了测序,从MH63的物理图谱中挑选了 4,751个BAC进行了测序。利用平台上的postHGAP对经过HGAP组装之后的序列进行处理之后,分别得到4,571个和4,488个BAC的序列,平均长度分别为121 kb和151 kb。其中4,415个(ZS97)和4,320个(MH63)是完整的MTPBAC序列,分别占所挑BAC总数的94%和91%。2)对测序组装得到的ZS97和MH63全基因组的Gap大小和序列准确率进行了评估,ZS97的Gap总长约为36.6MB,MH63的Gap总长约为26.2MB。根据ZS97和MH63的BAC与BAC之间的重叠区域评估结果显示本研究的序列准确率达到了99.9%以上。3)基因组结构变异检测。检测出了 ZS97和MH63之间有131个Inversion,分别对应ZS97和MH63的总长度为1,960,828 bp,1,848,622 bp。ZS97和日本晴之间有357个Inversion区域,分别对应ZS97和日本晴的总长度为4,660,163 bp,3,217,139 bp。MH63和日本晴之间有402个Inversion区域,分别对应MH63和日本晴的总长度为 5,642,744bp,4,284,365 bp。检测出了 ZS97 和 MH63 中存在 5188 个 Translocation事件,对应的ZS97的总长度为8,943,636 bp,MH63总长度为8,942,631 bp。
其他文献
土壤侵蚀阻碍了半干旱地区牧场生态系统的恢复和发展,受到山区短时强降雨影响,再加上较低的植被覆盖和不适当的粗放管理模式,导致西白杨沟地区大量肥沃土壤流失,为小流域综合治理增添难度。本研究的目的是量化最初的土壤侵蚀,研究不同植被覆盖度与土壤侵蚀相关的径流和泥沙的时间变化特征,为平衡区域经济发展与水土流失治理工作提供适宜的思路指导。基于此,在西白杨沟采用模拟降雨试验评估植被因子、雨强因子、坡度因子对水力
针对瓦石峡凹陷及阿尔金山前冲断带所分布的侏罗系烃源岩及油砂,作者开展了野外地质调查、样品测试、分析。对烃源岩的生烃条件,油砂与源岩的地球化学特征和生物标志化合物特
种子活力(Seed vigor)是指在广泛田间条件下,决定种子或种子批迅速整齐出苗和长成正常幼苗的潜在能力的种子特性,是衡量种子质量高低的重要指标之一。现有的种子活力检测方法
机床行业是“母机”行业,作为最为重要的战略性产业之一,在各工业发达国家得到高度重视。2015年起,国家全面推进实施制造强国战略,高档数控机床和机器人等10大重点领域成为战略任务。同时明确了以加快新一代信息技术和制造业深度整合为主线,以推进智能制造为主攻方向,以满足经济社会发展和国防建设对重大技术装备需求为目标,强化工业基础能力。同时在以智能化生产为特征的工业4.0时代,精密化、智能化系统在生产中大
目的:通过随机、双盲双模拟、阳性药平行对照、多中心研究的方法来评价复方奥美拉唑干混悬剂治疗十二指肠溃疡的有效性和安全性。方法:选取240例入组,试验组120例,对照组120例。经筛选后,实际入组人数221例,试验组109例,对照组112例。试验组每日口服复方奥美拉唑干混悬剂(规格:6g/袋,1次/天,1袋/次),奥美拉唑镁肠溶片模拟剂(规格:20mg/片,1次/天,1片/次)。对照组每日口服复方奥
地图衣属(Rhizocarpon Ramond ex.DC)隶属于真菌界(Fungi)、子囊菌门(Ascomycota)、茶渍纲(Lecanoromycetes)、地图衣目(Rhizocarpales)、地图衣科(Rhizocarpaceae)。该属地衣的显著特征为地衣体壳状,裂片龟裂状,颜色多样,有白色、黄绿色、灰色、棕色及褐色。子囊盘为黑色、网衣型,子囊棒状至椭圆形,内含单孢、双孢或3~8孢,
随着市场经济体制改革不断深化,中小民营企业在我国经济体系中发挥着日益重要的作用。但是,融资难及融资过程中产生的一系列控制权争夺问题也日益成为中小民营企业进一步发展的瓶颈。企业的进一步发展,往往离不开外部资本的支持。但由于社会文化环境及历史因素的影响,我国民营企业家往往习惯于采用关系治理来管理公司,这与外部资本的价值创造和利益保护动机相冲突,由此导致外部投资者为了保护自身利益而要求加入公司治理当中来
活性污泥法处理过程中,污泥膨胀和其他干扰因素严重影响建立污水处理过程,因此使用神经网络自适应控制难以建立精确的数学模型。为改善污水处理性能,需要设计出针对污水处理过程分析与控制的有效方案。现有的神经网络自适应控制方法大都基于一致渐近有界理论而不是有限时间有界理论,而在污水处理中有限时间控制更有应用价值。论文根据污水处理过程不同阶段的特性进行分析,研究污水处理过程神经网络自适应有限时间控制。首先,针
旋转机械振动信号是非稳态信号,其故障诊断是一个难题。本文在研究希尔伯特振动分解算法的基础上对其实行了改良,用于齿轮和轴承故障识别,并证验所提方法的有效性。本文所做的工作和取得的成果如下:1、研究了希尔伯特振动分解的分解能力,通过仿真信号分析找出希尔伯特振动分解的缺陷,然后提出了基于镜像延拓的希尔伯特振动分解方法,解决了希尔伯特振动分解方法的端点效应缺陷;利用仿真信号分解比较了希尔伯特振动分解方法和
阅读是搜集处理信息、认识世界、发展思维、获得审美体验的重要途径。阅读教学是语文教育的重要组成部分,新课程改革对语文阅读教学提出了更高的要求。本文在新课程理念的指导下,依据阅读教学的原则,以百色民族高中为个案,通过调查和访谈,了解新课改背景下高中语文阅读教学的现象及存在的问题,分析问题的原因并探索改进策略。希望能指导百色民族高中的教学实践,充实少数民族地区新课程改革的实践案例。文章由绪论、主体、结语