论文部分内容阅读
染色体易位是染色体结构异常中很常见的一种,是女性自然流产、胎儿畸形或者胎儿染色体异常的重要原因之一。导致染色体易位的因素有很多,除了双链断裂修复、组蛋白修饰等与染色体易位有关,染色体的空间折叠结构与活性也是形成染色体易位的重要因素。随着科学技术的空前发展,越来越多的研究表明,真核生物染色质在细胞核内的空间组织形式对DNA的空间分布有重要影响,因而对DNA复制、基因转录或远程基因调控等生物学过程具有调节作用。目前对这种空间上高度有序的基因组结构的认识还是粗糙的、碎片式的和不完整的。近年来,随着线性基因组的发展,研究者利用荧光原位杂交、染色质构象捕获(chromosome conformation capture,3C)等技术,更加深刻了解到细胞核内染色质的三维构象以及其丰富的内容。而基于染色质构象捕获技术发展起来的衍生技术——Hi-C(highest-throughput chromosome conformation capture)技术,则是一种在全基因组范围内研究染色质相互作用以及探明全基因组三维结构的分析技术。虽然Hi-C技术来源于3C,但整个操作过程比3C的步骤还要繁琐,涉及到的不同酶类等试剂、器材众多,而且自从3C技术出现以来,其相关流程本身也出现了一些改变。因此本研究按照目前较比繁杂、不容易进行质量控制的常规Hi-C方法来验证该常规Hi-C流程的可靠性,并利用Hi-C技术能够对染色质内部或所有染色质之间的相互作用进行精细分析,从而把基因表达调控引入到空间的、全局性的研究层面,为全面解析与DNA有关的生物学过程的机理开启新的契机。目的:应用常规Hi-C建立文库方法,验证Hi-C流程可重复性的可靠性,并留意其中的关键步骤和注意事项,为以后的研究者们提供参考依据。结合生物信息学分析技术,分析Hi-C数据及相应的热图,以期在全基因组水平上探究易位染色质的空间三维结构,探讨其空间三维结构及其与致病性的相关性,为染色体异常所造成的不良妊娠结局提供做一种研究方向及理论基础,对发现和治疗染色体易位造成不孕有重要意义。方法:在本研究中研究对象为中国人民解放军第一八一医院做外周血染色体核型分析的病人,选取2名染色体核型易位的病人及2名染色体核型正常的健康者,抽取其外周血,依据常规Hi-C方法建立文库并进行Hi-C测序。在将病例组与对照组分别进行全基因组Hi-C测序后,再对两组测序得出的原始数据分别进行初步生物信息学分析。生物信息学分析开始于测序原始数据的获得,首先在质控阶段将接头序列、接头污染的、低质量的序列去除,得到“clean data”。后续的分析都是在过滤后的数据基础上分析的。然后使用HiC-Pro的比对策略,调用bowtie2进行比对,即可得到比对到基因组唯一位置上的Reads对数。最后再利用Hic-Pro解析Hi-C数据,得到相应的矩阵热图。结果:(1)构建了4个Hi-C文库,对常规Hi-C流程的各个质量质控点的检测结果均符合Hi-C建库的要求。(2)病例组和对照组分别产生了947,652,970和913,192,394,00的原始Reads大约270Gb规模的序列,以100kb的分辨率测序得到了94.72%和94.95%的极高覆盖率。(3)病例组和对照组获得的顺式相互作用的Reads对数分别是237,062,419和266,285,718;反式相互作用的Reads分别是94,115,136和146,084,685。(4)获得全基因组水平上顺式相互作用与反式相互作用的比率。(5)获得病例组与对照组全基因组相互作用热图。(6)病例组和对照组的全基因组热图提示易位后的1号和X号染色体相互作用增强。结论:(1)通过常规Hi-C方法及对整个建库过程中的质量控制,本研究建立的4个Hi-C文库都是符合要求的,证实了常规Hi-C流程的可靠性。(2)本研究中Hi-C顺反式相互作用数据得知,不论疾病组还是对照组顺式相互作用均大于反式相互作用,这种相互作用模式可能在细胞类型或种类上具有稳定性。(3)本研究中染色体交互热图表明染色体内的相互作用强于染色体间的相互作用,这可以指导核酸片段的染色质分群。(4)Hi-C实验获得的染色质相互作用频率在一个给定范围内一般随距离的增大而衰减。染色质片段间的交互强度呈现出随距离衰减的规律。(5)对比病例组与对照组全基因组交互热图发现,病例组中1号和X号染色体相互作用比对照组强,可能是1号和X号染色体发生易位后,空间距离变小,从而导致相互作用增强,推测空间距离较近的染色体相互作用较强。