论文部分内容阅读
肝癌作为临床上常见的恶性肿瘤之一,是一种发生于肝脏系统,具有明显民族聚集性和地域差异性的恶性肿瘤。其全球发病率呈逐年增长趋势,位居全球各种癌症的第五位,在我国,发病人数约占全球的55%。目前,肝癌5年生存率尚不到10%,全世界每年由于肝癌死亡的人数可达60万,病死率位于第三位;肝癌在我国肿瘤相关死亡中位居第二位,仅次于胰腺癌(4.4%)。原发性肝细胞癌(HCC)是一种发生在肝叶的肝细胞恶性癌变。但原发性肝细胞癌的发病机理迄今尚未完全确定。近年来研究表明,乙型、丙型肝炎病毒混合感染,黄曲霉毒素及环境等因素均为诱发肝癌的危险因素。肝癌的发生是多基因参与、多步骤改变的复杂过程,其分子调控机制仍未完全阐明。乙型肝炎后肝硬化是一个全球性的慢性疾病,绝大部分HCC是由乙型肝炎、肝硬化发展而来。我国的肝癌患者多数都有乙型肝炎病史,然而大量乙肝感染而无肝硬化者,其肝癌发生率远远低于有肝炎后肝硬化者,并且肝硬变在HCC中并发率达84.6%,而肝硬变后HCC发生率达49.9%,提示乙型肝炎后肝硬化(Post-Hepatitis B liver cirrhosis,以下简称乙肝后肝硬化)是乙型病毒性肝炎向肝癌发展中的一个重要中间环节。因此,阐明肝硬化的发生机制,对发现肝癌发生前早期阶段的基因异常有着重要意义,并有助于肝硬化的早期诊断与肝癌发生分子机制的揭示,为进一步研究肝硬化在肝癌发生发生过程中的作用奠定了分子水平的基础。基因芯片(DNA微阵列)是上世纪九十年代,随着计算机技术和基因组测序技术的发展而发展起来的一种新型的生物技术,它能够平行、高通量地监测成千上万基因转录本的表达水平,从而为系统地监测细胞内mRNA分子的表达状态进而推测细胞的功能状态提供了可能。高通量表达谱芯片技术的应用,产生了海量的、复杂的生物信息数据。因此,需要一种新的技术和手段去深入挖掘和阐述隐藏在这些数据背后的生物信息和知识。生物信息学以生物芯片研究为基础,并结合序列比对、统计分析方法、可视化作图、生物聚类、生物分子网络及通路分析等方法,进行生物信息数据挖掘,从而更加全面地对疾病进行系统研究。本研究首先利用BRB-ArrayTools软件对6张表达谱芯片(正常肝组织样本和肝硬化组织样本各3例)进行分析,得到肝硬化组织与正常肝脏组织差异基因680个,其中上调表达基因有147个,下调表达基因有533个。在对差异基因进行GSEA及DAVID、PANTHER等多种生物信息学工具的综合分析时,我们发现,在生物学过程中,在肝硬化差异基因功能主要集中在如蛋白质的合成、降解及修饰加工、生物大分子的代谢、角质形成细胞和上皮细胞的分化、一些酶,尤其是激酶、免疫应答、磷酸酶的催化活性,细胞代谢及信号转导等过程。参与通路主要富集于胰岛素信号通路、Cytokine-cytokine receptor interaction信号通路、G蛋白信号通路、Wnt signaling pathway、炎症介导的趋化因子和细胞因子的信号转导通路、Nicotine degradation信号通路、Huntington disease信号通路、钙信号转导通路、TGF-beta signaling pathway及Mechanism of Acetaminophen Activity and Toxicity信号通路等,其中胰岛素信号通路与Cytokine-cytokine receptor interaction信号通路具有最重要的意义。最后,利用Cytoscape和HPRD(human protein reference database)蛋白相互作用数据库对差异基因进行蛋白相互作用网络构建,首先,在HPRD数据库中,检索肝硬化上调蛋白中有577个与之匹配的PPI对,肝硬化下调蛋白中有539个与之匹配的PPI对。其次,对得到的PPI对用Cytoscape构建蛋白相互作用网络图,对网络图进行节点度和所有节点平均度的计算,得到大于或等于10倍所有节点平均度的节点,即中心节点(核心蛋白)。得到的核心蛋白有ATM、 ITGB4、KRT18、MDFI、CSF2R、DCTN1、ING1、LRP1、PDLIM7、VHL等。这些蛋白质在肝硬化相关蛋白质PPI网络中有至关重要的作用。