论文部分内容阅读
拷贝数变异(copy number variation,CNV)是指DNA片段大小介于1kb到数兆范围内的缺失,插入、重复和复杂多位点的变异。研究表明,CNV广泛存在于包括人类在内的动植物基因组。由于CNV所涉及基因组中覆盖的核苷酸总数超过了SNP的总数,可通过基因剂量和基因调控区域的改变影响基因的表达、表型变异以及进化适应性,是遗传变异和表型差异的重要来源,在复杂性状的发生发展中起着重要的作用。绵羊的生长发育性状受到基因和环境共同作用的影响,寻找DNA分子差异及其对应的基因是绵羊遗传育种的关注点之一,其中CNV对表型构成及疾病发生的调控作用已成为研究的热点。CNV与GWAS(genome wide association study)的结合为揭示复杂性状的遗传基础提供了重要的途径。为此,本研究利用illumina的高密度Ovine SNP50K BesdChip芯片对绵羊基因组进行分型,通过PennCNV软件检测拷贝数变异在绵羊基因组的分布特征,并首次构建了基于SNP分型数据的绵羊全基因组CNV图谱。研究结果显示,经过严格的质量控制,共检测出238个CNVRs,包括219个缺失事件(Loss),13个获得事件(Gain),6个既有缺失又有获得事件(Both),平均大小和中位数大小分别253.57kb和186.92kb,大小范围13.66kb~1.30Mb。经另一个CNV检测软件—CNVpartition进行相互验证,一共检测出52个CNVR,其中47个CNVR与PennCNV软件推断结果一致。这些CNVR在染色体上呈现非随机分布特点,每条常染色体均检测出CNVR的存在,其中富集CNVR最多的染色体为1、2和5。群体频率大于3%的CNVR有75个,这些CNVR与邻近SNP标记进行连锁不平衡分析表明,仅有两个CNVR被邻近SNP所标签,提示在illumina分型平台上,绝大多数CNVR未被邻近SNP所标签。对检测的CNVR进行基因含量注释和功能富集(GO)分析表明,发现多数基因富集于嗅觉、感官知觉、化学刺激、识别、神经系统的传递进程等环境应答相关的基因,另有一些基因与信号转导、信号通路、细胞分化与凋亡及GTP酶的活性等有关。为了判断CNV检测的准确性,选择10个CNVR进行定量PCR的验证,其中5个CNVR区域验证成功。本研究发现的CNV对了解绵羊基因组结构特征,填补绵羊基因组CNV精细图谱,加快绵羊育种的遗传进展以及CNV作为关联研究中潜在的遗传标记揭示表型变异提供重要的基础。为更好的揭示CNV在绵羊生长发育中的作用,本研究在绵羊全基因组CNV分析的基础上,对检测出的CNVR进行了重新定义,共得到402个新的CNVR,其中143个CNVR(群体频率>3%)定义为CNP(copy number polymorhism),对绵羊初生重、125天校正日龄重(断奶重)、190天校正日龄重(六月龄重)、断奶前日增重、断奶后日增重、平均日增重、体高、胸围和管围等11个性状表型进行了全基因组CNP的关联分析。采用混合线性模型对上述11个性状表型的CNP关联结果显示,共32个CNP区域与各表型性状显著关联(P<0.05),其中5个CNP与初生重显著相关,2个CNP与125天校正日龄重显著相关,9个CNP与190天校正日龄重显著相关,6个CNP与背膘厚度显著相关,3个CNP与眼肌面积显著相关,3个CNP与断奶前日增重显著相关,8个CNP与断奶后日增重显著相关,10个CNP与平均日增重显著相关,10个CNP区域与体高显著相关,5个CNP与胸围显著相关,5个CNP与管围显著相关。这些显著关联区域,经过FDR(false discovery rate)多重检验校正,除断奶后日增重关联的CNP-393在基因组水平显著外(p<0.05),其余CNP均不显著。另外,多数CNP区域影响多个性状,同时一些性状也受到多个CNP区域的影响,说明上述性状表型受到多微效基因的影响,并且各性状之间存在一定的遗传相关。研究结果还发现绵羊21号染色体上位于52788004~52907062区间的CNP-210对125天校正日龄重、190天校正日龄重、断奶前日增重、平均日增重以及体高性状显著关联。尤其是位于此区域上的NADSYN1和MRGPRG基因可能在绵羊生长发育过程中起着重要的作用。研究结果同时发现,基因组水平显著的CNP-393区域(绵羊9号染色体:76545109~76642439)的上游4.5Mb处的TRHR基因可能通过骨骼肌的发育调控作用,进而影响羔羊生长发育性状。本研究表明,CNP210和CNP-393可能是影响羔羊生长发育的两个遗传变异区域,可作为候选区域进一步进行功能验证和分析。综上,通过我们对绵羊全基因组CNV的分析,为了解绵羊复杂性状表型变异的遗传基础提供了新的思路,有助于对绵羊基因组的特征更加全面的了解,为进一步揭示绵羊生长发育遗传变异提供了重要的信息