猪转座组注释、活性分析及其对基因组、转录组和功能基因的影响

来源 :扬州大学 | 被引量 : 1次 | 上传用户:zxebabi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几十年来,大量生物基因组注释研究表明,转座元件(Transposableelements,TEs)或转座子(Transposons)及其可识别的残余成分,也称为转座组(mobilome),在原核生物和真核生物中广泛分布,对生物的基因组和基因进化发挥重要作用,转座子已成为后基因组时代的研究热点。但关于猪基因组中转座成份的注释还比较粗略,遗漏了大量信息,缺乏对猪转座组的多样性、进化、转录和转座活性及其对功能基因影响等信息的系统解读。同时转座子插入多态分子标记在猪等家畜中研究报道很少,其研究的深度和广度还远不及人类、小鼠和植物。基于此,本论文主要开展了以下研究工作:1.使用多个软件重新挖掘猪基因组中的反转录转座子,并进行了系统分类、进化动力学和插入年龄分析,构建了新的猪重复序列数据库;2.利用新构建的猪重复序列数据库,对猪基因组和转录组进行重新注释,揭示其对基因组和转录组的影响;3.根据RepeatMasker注释结果,探究了转座组对宿主基因(蛋白质编码基因和lncRNA基因)的影响;4.对年轻反转录转座子进行了转录活性、启动子活性和转座活性检测研究;5.以SINE为例,系统解析了转座子插入多态对基因外显子结构变异的影响;6.以生长发育重要候选功能基因GHR为例,系统研究了转座子插入多态对其结构变异的影响及其与表型的关联性。主要结果如下:1.从猪基因组中共鉴定到5937条L1序列,分为四个家族(L1A、L1B、L1C和L1D),53个亚家族。分析表明猪L1具有典型的哺乳动物L1的结构(5’UTR、ORF1、IGR、ORF2和3’UTR),总长度在5837bp到8822bp之间,5’UTR的长度变异较大,在551bp到3254bp之间,大多亚家族的IGR较长(390bp到529bp)。两个ORF比较保守,分别为900bp左右和3800 bp左右。四个家族呈现出不同的进化模式,每一个家族主导一个特定时期的进化活动,结合年龄分析表明,它们较其他LINE年轻,L1D是最年轻的一个家族,L1D1-7代表了最年轻的七个L1D亚家族。在L1D家族中共鉴定到98条结构完整的L1拷贝,含能够编码L1蛋白的两个ORF,可能具有转座活性。2.根据SINE序列的长度、相似性及结构特征,将其分成三个家族(SINEA、SINEB和SINEC),25个亚家族,均属于tRNA起源。三个SINE家族的长度差异明显,SINEA的长度在250 bp左右(不含polyA尾),而SINEB和SINEC相对短一些,分别为200 5p左右和120 bp左右。在基因组进化过程中,SINE呈现出三个扩增波,每个扩增波对应一类SINE转座子家族。年龄分析表明SINEA是最年轻的家族,其中SINEA1、SINEA2、SINEA3代表最年轻的三个SINE亚家族。3.ERV是LTR类反转录转座子的主要成员,分为18个家族,大多数ERV家族相对较为古老且已失去转座活性,长度大多分布在8.5kb到11 kb之间。而ERV6在近1000万年仍然比较活跃,插入年龄分析表明,ERV6是最年轻的家族,被进一步分为两个亚家族(ERV6A和ERV6B),各包含1个能编码含gag、pol和env的长肽的拷贝,可能具有转座活性。4.转座组注释结果表明,反转录转座子占基因组的37.13%(929.09MB),其中LINE、LTR和SINE分别占基因组的18.52%、7.56%和11.05%。DNA转座子相对而言非常少,仅占基因组的1.99%。最年轻的七个L1亚家族(L1D1-7)只占基因组的0.17%。最年轻的三个SINE亚家族(SINEA1-3)仅占0.63%,而其中最年轻的两个ERV亚家族(ERV6A和ERV6B)仅占基因组的0.02%。5.通过生物信息分析,超过80%的蛋白编码基因和1ncRNA基因含有转座子的插入,约一半的蛋白编码基因(44.30%)和四分之一(24.13%)的1ncRNA基因含有年轻反转录转座子的插入,并且约一半的蛋白编码基因(43.78%)与反转录转座子产生融合转录本。进一步分析发现,反转录转座子在蛋白编码基因和1ncRNA基因及其他们的转录本中的含量、插入位置和插入方向存在明显的偏好性。6.通过反转录转座活性实验验证了猪基因组中年轻L1具有转座活性。实验证明无论以自身的5’UTR作为启动子还是替换为CMV启动子,都能够在HeLa细胞中发生反转录转座,但转座活性显著低于人的L1(p<0.01)。当把猪L1的IGR替换为人L1的IGR时,猪L1的转座活性显著提高(p<0.05)。7.通过双荧光素酶报告系统证实,来自L1D1、L1D2和L1D7的三条正向5’UTR和一条来自L1D2的反向5’UTR在不同细胞系中检测到弱启动子活性。ERV6B的正向LTR呈现出较高的启动子活性,而ERV6A的正向LTR和ERV6B的反向LTR呈现出中等启动子活性,ERV6A的反向LTR在本次研究中未检测到启动子活性。8.三类年轻反转录转座子在多个组织和细胞系中均检测到正反向转录产物。在除生殖器官外的各组织和细胞系中呈现出相似的转录模式并且均有反向转录产物,而在生殖器官中呈现出不同的转录模式,在睾丸中L1的ORF1、ORF2,ERV的gag、pol和env的正向转录以及ERV的LTR的反向转录受到抑制,但可以清楚的检测到L1的5’UTR的反向转录产物。另外,SINE在卵巢中正反向均检测到转录,但在睾丸中却未检测到转录。在大脑和小脑中观察到较高的ERV6-LTR的反向转录水平。9.SINEA、SINEB和SINEC三个家族在基因组中的插入位点总数为1204691个,其中在基因的外显子区共鉴定到24024个插入位点,其中在编码区(CDS)共鉴定到792个,非编码区23232个,对应约30%的基因。通过比较不同年龄的SINE插入位点多态频率,发现越年轻的SINE亚家族,多态频率越高。对外显子区最年轻的三个亚家族(SINEA1-3)插入位点进行全面比对分析和实验验证,最终筛选出151个多态位点,多分布在非编码区。10.GHR基因及其侧翼区的转座子注解后发现含有155个转座子插入,绝大部分为反转录转座子(152/98.06%),对应25.63%的序列。其中SINE类转座子最多,有74个,而其中68个来自最年轻的家族SINEA,对应5.64%的序列。对获取的15条来自不同品种基因组的GHR基因及侧翼序列比对后发现34个长度超过50 bp的结构变异,且全部为转座子插入多态引起。选取部分转座子引起的结构变异位点进行实验验证,获得5个转座子插入多态位点,其中1个在大白群体中检测后发现纯合转座子插入基因型(SINE+/+)的个体的校正背膘厚显著小于纯合无插入基因型(SINE-/-)的个体。研究对猪基因组中转座成份进行了系统的挖掘、分类、进化分析、活性分析和注解,并系统评估了转座组对基因组、转录组和功能基因的影响,并进行了分子标记挖掘及应用评估,研究结果为更加全面、深刻的认识和理解猪转座组提供了实验依据和理论基础,并为开发猪基因组新型分子标记,进行重要经济性状的精细定位提供参考。
其他文献
介绍了电灯的由来,探讨了黄灯时间的长短对交通安全正负两方面的影,在应用力学和运动学原理的基础上,提出了一种计算黄灯时间的模型.分析了模型建立的全部过程,最后列出了黄灯时间
基于神经网络对数据链指挥下的战斗机提出了鲁棒飞行控制器设计方案.为了克服由于数据链的引入对战斗机飞行控制所带来的不利影响,设计了基于RBF神经网络的鲁棒飞行控制器.通过
高露洁公司总部位于美国纽约,公司70%的销售份额来自国际市场,80%的雇员来自海外。因此,高露洁公司必须建立完善的全球供应链管理。高露洁公司总部位于美国纽约.是一家资产达94
<正> 前言 高聚物的补强是通过向高聚物中加入或复合补强材料来完成的。补强性能的好坏取决于高聚物与补强材料界面之间的亲合性。 橡胶为有机高聚物,而非炭黑填料(如二氧化
zeste基因增强子同源物2(EZH2)是果蝇zeste基因增强子[E(z)]的人类同源物组蛋白 甲基化的重要工具酶,也是多梳基因家族PcG(polycomb group)的核心成员.EZH2参与多梳蛋白复合 体2的
【正】 1940年9月27日,德意日在柏林签订三国同盟条约,建立了三国军事同盟.三国同盟的建立,对日本来说,是其加速解决南方问题的外交准备.它的根本目的是利用德国的力量牵制美
采用溶液浇注法制备丝素蛋白薄膜,应用傅里叶红外光谱(FTIR)和X射线衍射(XRD)研究了浓度不同的甲醇-水混合溶剂处理后丝素蛋白薄膜的结构变化,并以罗丹明B为模型药物与丝素蛋
以酚醛环氧树脂(F-51)、丙烯酸(AA)、γ-氨丙基三乙氧基硅烷(KH-550)及异氟尔酮二异氰酸酯(IPDI)为原料,制备了电子束/潮气双重固化有机硅杂化环氧树脂。采用傅里叶转换红外光谱法,对
学习策略的研究是当今教育心理学研究的一个热点.本文对学习策略研究中较有争议的问题,诸如学习策略的实质、学习策略的类型作了简要评析,分析了当今学习策略研究的主要进展,