以复杂多倍体植物为例的常规基因组分析流程搭建

来源 :浙江大学 | 被引量 : 0次 | 上传用户:gongpeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着测序技术的变革和高通量测序技术的发展,越来越多的基因组被测序,大量的基因组数据尤其是多倍体基因组数据的复杂性,对生物信息学分析提出了更高的要求。多倍化使基因组的规模变得更大,同时多倍化在基因组中造成了大量的冗余,其基因组、转录组数据的生物信息学分析和数据整合则变得更为复杂。本研究以作物杂草稗草为例,通过比较不同的生物信息学软件和方法,选择、整合最适用的生物信息学软件和方法,确定复杂基因组分析流程。  该流程具体包括三项分析功能:(1)基因组拼接质量评估:根据基因组拼接的参数,拼接基因组大小和序列完整度独立测定等,对从头拼接的多倍体基因组拼接质量进行评估;(2)基因组注释:通过重复序列的特征和转座子的结构对基因组的重复序列进行预测,并结合已知的重复序列库进行重复序列的注释;利用两种不同的从头预测的方法,并结合从头拼接的转录组序列和基于基因组拼接的转录组序列,进行基因组的基因预测,并对不同方法的预测结果进行整合优化;结合已知的蛋白序列数据库、蛋白家族数据库、基因功能注释数据库和蛋白生物通路数据库对基因进行基因注释和功能注释;(3)比较基因组学分析:比较不同物种基因序列的相似性并以聚类的方法进行直系同源和旁系同源基因识别;比较不同物种基因组上基因的相似性并根据基因在基因组上的位置,找出不同物种基因组之间的共线性区段,分析不同物种基因组之间的共线性关系;比较不同基因组之间共线性区段的基因对序列,通过对序列四重简并位点的分析,计算遗传距离,估算物种间的分化时间等。  本研究最终整合优化基因组分析过程中最适用的生物信息学分析方法和软件,搭建了一套多倍体复杂基因组的基因组注释及比较基因组学分析流程,并利用Perl语言使相关过程自动化运行,为从事植物复杂多倍体基因组研究团队提供了一个实用的生物信息学分析工具。  
其他文献
验证了GB/T 3185—2016氧化锌含量测试方法中存在的问题,指出其滴定终点不易判断,无法掩蔽钙类金属杂质的干扰导致测试结果存在误差.通过大量验证试验,建立了测定氧化锌含量
期刊
湖泊富营养化是我国最重要的环境问题之一。为了增强植物对湖泊富营养化水体的适应能力,本文研究水溶性壳聚糖对水生植物轮叶黑藻抗冷和抗污能力的影响及壳寡糖的不同分子量、
高速公路竣工的验收环节需要对运行期间的噪声进行监测,才能确保施工期间的整体质量,也为高速公路后期的使用奠定良好的基础。所以从监测的技术层面来说,文章阐述了高速公路践行噪声监测实践的意义,对高速公路工程项目竣工验收噪声监测的工作中的相关要求以及注意要点进行总结,以期能够做好高速公路工程竣工验收工作,提高高速公路的实用性以及可靠性,降低高速公路产生的交通噪声对周边住宅户的影响程度。
期刊
我国拥有13976份小麦地方品种资源,约占我国目前小麦种质资源保存总数的三分之一。在历史上,小麦地方品种对我国的小麦育种和生产作出了巨大贡献。中国的小麦地方品种还携带有许多优良基因。例如,从“齿牙糙”发现的AB24基因,对白粉病具有很强的抗性:“望水白”是当前最好的赤霉病抗源之一。地方品种有益基因资源的发掘和利用对于现代小麦品种改良具有重要的意义。本研究通过对来自我国黄淮麦区两个副区的小麦地方品种
本试验于吉林农业大学试验站试验田内进行,供试品种为吉油一号和通油一号。供试肥料为优质猪圈肥。试验共设五个处理。处理1为对照(单施无机肥),其余四个处理为有机无机肥配合施用。采用随机区组排列,三次重复,密度为50000株/hm~2。在整个生育期内跟踪测定株高、茎粗、叶面积指数、叶片叶绿素含量、可溶性糖含量、可溶性蛋白含量、丙二醛含量、硝酸还原酶活性,籽粒的灌浆速率、干物质积累速率、蛋白质、粗脂肪、淀
8月23日,第14次中国—东盟(10+1)经贸部长会议在马来西亚首都吉隆坡举行。高虎城在会上表示,2015年是东盟共同体建成之年,中国期待见到一个更加融合、更加繁荣的东盟。当前,
水资源危机和农村劳动力匮乏问题促使水稻栽培方式出现由传统移栽稻向旱直播稻的转变。对比于常规稻品种,杂交稻品种具有更高的产量潜力。但是,旱直播水稻所要求的高播种量与杂交稻品种的昂贵价格相结合使杂交稻品种难以在旱直播系统中得到大规模推广。一些研究报道,杂交稻品种在早期生长中比常规稻品种具有明显的生长优势。这种具有的生长优势可能使杂交稻品种在生长早期克服低播种量的不利影响,最终取得高产。本试验研究以一个
期刊
期刊