论文部分内容阅读
诱导多能性干细胞(induced pluripotent stem cell,iPSC)在再生医学、体外疾病模拟和药物筛选等领域都有很好的应用前景,然而重编程效率低的问题严重阻碍了iPS细胞的广泛应用。Oct4、Sox2、Klf4、cMyc(简称OSKM)等体细胞重编程过程关键转录因子(TF),在体细胞身份转变中发挥着十分关键的先锋调控作用。前期关于OSKM靶向调控体细胞基因组重编程的研究主要集中在编码蛋白基因的启动子调控区域,筛选出一些可替换的关键基因。近期,越来越多的证据表明长链非编码RNA(long non-coding RNA,lncRNA)在体细胞重编程过程中具有同样重要的调控作用,但关键转录因子在该区域的动态靶向调控模式仍未系统分析和研究。本研究首先绘制了小鼠体细胞重编程关键时间点Oct4、Sox2、Klf4、cMyc、Nanog和Esrrb共计6种转录因子的靶向结合染色体分布模式,结果表明多能性TF对于重编程的调控主要在9、10、13和17号常染色体上,并且倾向于结合在启动子含内源性逆转录病毒K(ERVK)的lincRNA上。进一步,通过整合ATAC-seq数据,我们发现重编程过程中OSKM按重编程时间分批逐渐地共结合到全基因组的靶点上,而且OSKM的结合与染色质的开放是一致的。随后,通过联合TF-binding基序分析,我们发现体细胞重编程过程中lncRNA启动子和增强子区域的体细胞特异性TF结合逐渐减少、而多能性特异性TF结合逐渐增强;启动子区域结合的OSKM与组蛋白修饰H3K4me3、H3K27me3、H3K79me2及组蛋白变体H3.3协同调控lncRNA的转录;另外,研究还探索了小鼠体细胞重编程过程中OSKM结合启动子偏好与lncRNA特征的关系,包括lncRNA类型、转座元件(TE)含量、转录本长度、第一外显子长度、第一内含子长度以及到多能性基因的距离。结果发现OSKM偏好结合到正义重叠lncRNA和反义lncRNA等与蛋白编码序列重叠的lncRNA类型,还偏好结合到启动子含ERVK、较长转录本、较长第一内含子、以及多能性基因10-20 kb范围的lncRNA启动子区域。进一步,本研究通过iPSC多能性蛋白编码(Protein-coding,PC)基因与lncRNA的相关性分析,找到了210个iPSC多能性网络相关lncRNA,构建了一个PC-lncRNA基因共表达网络,筛选出一些可能在iPSC多能性网络中发挥重要调控作用的关键lncRNA,其中Platr家族、Panct2、D230017M19Rik和4930461G14Rik等已经被证实,从一定程度上证实了本研究结果的可靠性;同时,我们还挖掘出一系列新的lncRNA,例如Tnfsf13os、Gm44699、Gm26917、Gm31793、Gm16302、Gm48604等。总之,本论文描绘了小鼠体细胞重编程过程关键转录因子在lncRNA区域的动态结合模式,研究了体细胞重编程过程关键转录因子与表观遗传修饰协同调控lncRNA转录的关系,构建了一个iPSC多能性相关的编码基因-lncRNA共表达网络,研究结果可能对深入阐明体细胞重编程过程关键转录因子调控lncRNA的分子机制具有重要意义,为进一步筛选有效的非编码RNA重编程分子标记提供一定理论帮助。