论文部分内容阅读
致心律失常性右心室心肌病(Arrhythmogenic Right Ventricular Cardiomyopathy,ARVC)是一种原发性心肌病,主要特征为右心室心肌部分或全部被纤维或脂肪组织所替代,其死亡率高,严重威胁着人类的健康。目前研究认为ARVC是一种复杂遗传病,其发生与发展是在生物环境因素背景下,多个致病基因相互作用的结果,预测并鉴定ARVC的致病基因对深入理解其致病机制有着重要的意义。 采用实验的方法昂贵而耗时,通过生物信息学及计算生物学方法,在疾病相关网络中挖掘潜在的致病蛋白可以解决这个问题。近年来,复杂疾病候选基因的挖掘方法主要是基于代谢网络、转录调控网络、蛋白互作网络等生物分子网络。其中,蛋白质的相互作用调节各种功能(如:信号转导、基因调控等),是许多生物过程的关键组成部分。在蛋白质互作网络中,蛋白质是通过相互协作发挥其功能的,基于人类疾病网络及疾病基因网络的研究证明,致病基因比非致病基因彼此之间有更多的互作,并共享相同的GO功能类及KEGG通路,直接互作的蛋白质之间有相同或相似的作用,可以基于网络研究蛋白质与疾病之间的关联性。以往的研究主要利用OMIM数据库中检索描述中包含“疾病名称”的基因作为已知的致病基因,通过最近邻居扩增法构建疾病关联网络来挖掘可能与疾病相关联的候选基因,但这种简单的基于条件匹配的致病基因检索方法比较粗糙,可能存在假阳性或漏掉假阴性基因。针对这一不足,本研究采取基于网络分析并结合文献挖掘的方法来预测疾病相关的基因。为了更准确而全面的阐述疾病和基因之间的关系,在网络分析基础上,结合富集分析来进一步证实。可根据功能相似的基因可能表现相似的疾病表型这一理论,对网络预测得到的候选蛋白进行GO功能及KEGG通路富集分析研究。 本文首先利用文献挖掘及统计学检验的方法,筛选ARVC的“种子蛋白”,并采用“种子蛋白扩增”和蛋白质互作可信度加权,来构建加权的ARVC关联的蛋白质互作网络(ARVC-Related Proteins and Protein Interaction Network,ARVC-PPIN),建立蛋白质疾病关联得分策略,计算网络中蛋白质的得分并对其排秩,并将我们的疾病关联得分策略与高可信度的ToppGene软件进行比较。最后,通过富集分析和文献对ARVC候选蛋白进行证实,了解ARVC致病机制和发现潜在的疾病相关联的候选蛋白。分析排秩前100的候选蛋白,发现大部分候选蛋白及种子蛋白共享相同的与ARVC疾病相关的GO功能类及KEGG通路。如DES(rank2)已被证实是ARVC的致病蛋白;还挖掘到了ARVC的潜在致病蛋白如:VIM(rank1)与桥粒和核膜相连,可在心肌闰盘中表达;MYH6(rank3)的突变能够影响肌原纤维的形成,ACTC1(rank7)的突变能够扰乱心肌收缩等。因此,本文提出的方法可为鉴定新的ARVC致病蛋白及深入理解ARVC的致病机制提供一个有效的途径。