论文部分内容阅读
亨廷顿病(HD)由亨廷顿基因(HTT)第一号外显子中(CAG)n三联体密码重复扩增引起,是一种由常染色体显性遗传的神经退行性疾病。HD具有致死性,但目前国内外没有治愈的方法。micro RNA(mi RNA)是一种内源性小的非编码RNA,在转录后基因调控中起到重要作用。mi RNA编辑可能影响mi RNA的稳定性和靶标特异性。分析HD中的mi RNA编辑事件,可以提高我们对该疾病中mi RNA编辑或突变的认识水平,可能促进基于mi RNA靶向治疗方法的研究。我们收集111个已经公开发表的人类脑组织小RNA测序(s RNA-seq)数据,进行mi RNA编辑或突变的生物信息学分析。其中28个为HD样本数据,83个为健康个体的样本数据。111个s RNA-seq数据质量良好,满足生物信息学分析要求。Mi RME算法是用于发现s RNA-seq数据中mi RNA编辑或突变位点(M/E site)的一种新颖、准确和快速的检测方法,该算法主要有三个特点。第一,具有三轮序列比对步骤,可以实现具有高灵敏度的同时而又不降低运算速度;第二,使用交叉映射校正方法对映射到基因组中多个基因座的reads进行归一化,可以减少预测结果中的假阳性数量;第三,能够可视化分析发现的所有类型M/E site。我们利用Mi RME算法共识别出1890个编辑水平具有统计学显著性的M/E site。根据成熟mi RNA(mature mi RNA)核苷酸序列的位置和已有研究发现的mi RNA编辑类型,1890个M/E site被划分为9个类别,分别是592个3’-A、439个3’-U、401个Other、225个3’-Other、89个5’、69个SNP、41个A-to-I(G)、26个C-to-U和8个Pseudo(假阳性事件)。本研究发现人类脑组织中mi RNA发生核苷酸缺失事件共4个,未发现核苷酸插入事件。只发生1个M/E site的mi RNA前体(pre-mi RNA)数量最多,M/E site较集中在mi RNA中间区域;发生多个M/E site的mi RNA前体(pre-mi RNA)数量较少,M/E site较集中在mi RNA的3’端区域。HD大脑的prefrontal cortex(PC)组织中mi RNA编辑水平与健康个体大脑的PC组织中mi RNA编辑水平之间差异较小,与健康个体大脑的其它组织中mi RNA编辑水平之间相比差异较大。HD和健康个体间A-to-I(G)编辑水平差异较小。A-to-I(G)编辑类型共有23个发生在mi RNA种子区域(seed region),发生这些编辑位点最显著的样本都来源于健康个体的脑组织。与RADAR数据库和DARNED数据库相比,我们新发现10个A-to-I(G)编辑位点。A-to-I(G)对编辑位点5’一侧的核苷酸U有比较强的偏好性,对3’一侧的核苷酸G有比较强的偏好性。HD和健康个体间C-to-U编辑水平差异较小。4个SNP发生在mi RNA的种子区域。HD和健康个体间有164个M/E site具有统计学显著性差异,其中有4个M/E site发生在mi RNA种子区域,即hsa-mir-376a-1_49_A_g、hsa-mir-376a-2_55_A_g、hsa-mir-1301_52_A_g和hsa-mir-4454_4_G_u。利用PAR-CLIP(光活性增强的核糖核苷交联和免疫共沉淀)测序数据鉴定动物mi RNA靶标是非常有效的方法,MICPAR算法使用校正后的PAR-CLIP测序图谱进行mi RNA靶标预测。除hsa-mir-4454_4_G_u外,我们使用MICPAR算法预测剩下3个M/E site的mi RNA编辑前后的靶标,发现编辑后的mi RNA比编辑前靶向更多的基因,并且mi RNA编辑前后的靶标几乎不同。我们将这3个mi RNA编辑后的靶标分别与已公开发表的两个研究中报道的HD中表达失调的基因进行比较。hsa-mir-376a-1_49_A_g有34个靶标与两个研究中报道失调的基因相同,其中基因PAK1是共有的,PAK1被认为是神经系统疾病潜在的治疗靶标。hsa-mir-376a-2_55_A_g有42个靶标与一个研究中报道失调的基因相同,但与另外一个研究报道没有交集。hsa-mir-1301_52_A_g有51个靶标与两个研究中报道失调的基因相同,但没有共同的基因。本研究对3个M/E site,即hsa-mir-376a-1_49_A_g、hsa-mir-376a-2_55_A_g和hsa-mir-1301_52_A_g,编辑前后的靶标进行GO和KEGG分析,发现mi RNA编辑事件明显导致靶标发生变化,并且mi RNA编辑前后靶标的功能也发生了很大的变化,表明mi RNA编辑事件可能导致靶向另一组功能不同的靶标。