论文部分内容阅读
食管癌(esophageal carcinoma)又叫食道癌,是临床上最常见的消化道恶性肿瘤疾病之一。来自世界卫生组织国际癌症研究机构(International Agency for Research on Cancer, IARC)报告显示,食管癌发病率位于世界恶性肿瘤排行榜的第八位,其死亡率位于第六位。据统计,2008年食管癌的每年新发病例数约为48.23万例,其死亡病例数为40.68万例。中国食管癌的新发病例和死亡率均位居世界第一位。病理学研究证明,鳞状上皮来源的鳞状细胞癌是食管癌最常见的病理类型,而其他类型较少见。食管癌的分布呈现地域性特征。在世界范围内,伊朗北部穿越中亚共和国到中国北方,这一区域被称为“食管癌地带”。我国食管癌高发地区主要集中在太行山、秦岭、大别山以及川北、闽粤、苏北、新疆和甘肃等地理区域。中国北方的河南省安阳地区是食管鳞癌(esophageal squamous cell carcinoma ESCC)高发地区之一,也是世界上发病率最高的地区之一。我国研究者对食管癌进行了长期的研究并取得显著成绩,提出环境因素是食管癌病因的假说。然而,高发区中家族聚集现象以及同样暴露于相似环境因素的人群,却只有少数人发生食管癌,家族性食管鳞癌患者相对散发食管癌患者预后好,提示遗传因素对食管癌发生可能起到重要作用。此外,食管癌的病因普遍认为还可能与吸烟、饮酒、不良的生活和饮食习惯、环境、遗传因素、性别、年龄、职业、种族、地理、精神因素、化学物质含量高、食物被生物污染、营养缺乏等因素相关。目前,普遍认为食管癌是多因素共同作用,多基因参与,多阶段发展的疾病,而其发生和发展的确切机制较为复杂,目前尚未完全阐明。随着对高发区居民的早期肿瘤筛查和随访工作的加强,有一部分食管癌患者被发现并经过及时的治疗病情得到有效控制,提高了生活质量。但在实际中,多数食管癌患者的早期临床症状并不明显,没有引起人们的足够重视,往往被当做慢性炎症性疾病,给予抗炎治疗,当很多患者出现明显的进食疼痛和进行性吞咽困难等不适症状时,大多病情已属中晚期,往往失去了外科治疗、放射治疗、化学治疗和中医药治疗相结合的综合治疗的最佳治疗时机,治疗效果不理想。因此,食管癌的筛查和早诊早治具有重要意义。分子生物学技术融合了生命科学、信息学、微电子学、计算机科学等交叉学科的发展成果。应用分子遗传学和生物医学信息学技术对大量临床分子医学研究数据进行分析、发掘、整理,使我们在食管癌防治中全面、系统、准确的理解和运用分子医学理论和技术,具有重要的理论和应用价值。近年来分子医学技术的发展,特别是肿瘤临床分子医学的技术突破,使得肿瘤的早期风险预测和监控成为可能。越来越多的信号分子和通路被确证为抗肿瘤药物的治疗靶点,细胞毒类抗肿瘤药物也经历着逐渐转向为非细胞毒类的分子靶向药物,研究和开发分子靶向抗肿瘤药物成为一种新进展。然而,大多数分子靶向药物只能阻断一个受体,并不能阻断全部的信号传导,治疗效果往往不理想。利用分子生物技术研究和发现食管癌的特异基因的功能,从多靶点和多环节出发,对食管癌的治疗将具有重要意义。生物信息学作为一门综合了生命科学、计算机科学及信息技术等学科,通过计算机为研究工具来采集、筛选,处理、存储及传播、解释海量而繁复的生物信息数据,从而广泛的应用在生物工程行业、临床医学、药物产业、寄生虫与流行病学等研究,为发现新规律并阐述生物学的意义奠定了基础。人类基因组图谱完成,标志着我们进入到了以生物信息技术为核心,由基因组研究转为探索研究基因功能组学,从分子水平研究生物学功能的后基因组时代。随着后基因组时代的到来,生命科学领域随之出现了很多新的发展动向和相关新技术,基因芯片技术作为后基因组学基因功能研究的最重要工具之一,它从产生的海量数据中提取出隐含的有价值的生物信息,被广泛应用在基因的表达谱分析、基因分型(Genotyping)、比较基因组学分析、甲基化分析、chip-on-chip分析、小分子RNA (microRNAs)分析等生物学研究中,将基因功能、疾病的病因、分子机制等内容有机的联系起来。基因芯片(Gene-Chip)又被称为DNA芯片、DNA微阵列(DNA microarray)等,是生物芯片的一种,是最先研究也是最成熟的生物芯片。是为了获得样本中关于基因结构及基因表达信息,用微阵列技术将大量DNA片段通过机器人或原位合成方式有序的排列在固相支持物上,与带有荧光标记的生物样品的靶序列进行分子杂交,依据核苷酸分子形成双链过程中要遵循碱基互补配对的原则,将产生的杂交图谱排列出靶DNA的序列,检测出每个探针分子杂交信号的强度以便进行后续定量分析。基因芯片将难以想象的生物学信息进行集成化处理,使人类可以在分子水平上探索健康和疾病的奥秘,攻克肿瘤等不治之症。目前,基因芯片在肿瘤的基因表达谱研究中取得了卓越成果。我们利用BRB-array tools (version4.3.2Stable Release)软件,从NCBI的GEO数据库中获取"GEO project GDS number:3838"食管癌组织和癌旁组织的基因表达谱数据及相关基因的功能注释信息进行分析研究,希望能从食管癌的生物学性质、食管癌发生、发展的基本分子机制的研究中得到深刻认识,从而为疾病的预防和治疗等提供可靠的科学依据。本课题材料与方法:在GEO数据库中检索"esophageal carcinoma"关键词,从检索结果中选择登录号GDS3838的数据集进行数据挖掘。本研究的34个样本包括实验样本为17例人食管鳞癌组织和17例癌旁组织的活检标本,来自同一平台GPL571。利用BRB-array tools (version4.3.2Stable Release)软件包中的分类比较工具筛选食管癌差异表达基因,并用DAVID在线软件对差异表达基因进行BIOCARTA和KEGG pathway通路分析,发现参与肿瘤信号通路的15个食管癌差异基因,用STRING在线软件对差异基因进行蛋白质-蛋白质相互作用网络构建,最后利用GenClip对参与肿瘤信号通路的差异基因进行文献挖掘。研究内容包括以下两章:第一章:常用的几种生物信息学分析数据库介绍。对本文所使用的GEO数据库、DAVID、STRING数据库、GenClip作简要概述。基因表达汇编GEO数据库是最为知名的存贮和查询芯片数据的综合型数据库,DAVID是基于web的一种基因功能富集分析软件,STRING是用于构建蛋白质-蛋白质之间相互作用网络以及用生物信息学方法注释蛋白质功能的数据库,以及在线文献挖掘软件GenClip。第二章:食管癌组织基因表达谱数据挖掘和生物信息学分析。食管鳞癌基因表达谱芯片数据来源于NCBI的GEO数据库,登录号为GDS3838,同一平台GPL571,采用34个样本,包括实验样本为17例人食管鳞癌组织和17例癌旁组织的活检标本进行统计学分析。利用BRB-array tools分类比较工具分析,发现差异表达基因376个,其中上调基因有226个,下调基因有150个。然后,按照在线分析软件DAVID数据上传向导要求,按步骤上传376个差异基因,选择研究物种为人,信号通路分析数据库选择BIOCARTA和KEGG pathway数据库,发现这些差异基因在信号通路中主要参与了细胞基质受体相互作用、局部粘附、p53信号通路、细胞色素450代谢、膀胱癌、小细胞肺癌、肿瘤信号通路等。其中有15个基因,包括BID, CKS1B, GLI2, COL4A1, COL4A2, MECOM, FN1, ITGA6, IL8, LAMC2, MMP1, MMP2, MET, PGF, FOS参与了肿瘤信号通路,同时这15个基因中的部分基因也参与了其他信号通路。结果提示这些变化的信号通路可能在食管鳞癌的发生、发展中起着重要作用。此外,这些信号通路存在交汇,提示这些信号通路可能在食管鳞癌的发生中协同发挥作用。将376个差异基因在STRING数据库里构建蛋白质-蛋白质相互作用网络图,发现大多数基因蛋白质产物以线相连,提示它们之间有密切的作用关系。发现有一部分基因位于网络中心,作为关键连接和中介与周围其他基因产物之间关系都比较密切,再一次表明食管癌的发生是多基因参与共同作用的过程。最后,对这15个差异基因进行GenClip文献挖掘,明确它们在肿瘤发生中所起的作用。基于文献挖掘的方法我们发现筛选出来的参与肿瘤信号通路的食管癌差异基因与食管癌的发生可能具有相关性,文献挖掘结果也与本课题推论相一致。综上所述,本研究对GEO数据库上传的食管癌组织和癌旁组织的表达谱表达变化的基因进行生物信息学分析和再挖掘,希望能从食管癌的生物学性质,以及食管癌发生、发展过程的基本分子机制的研究中得到深刻认识,为全面了解食管鳞癌的分子网络变化提供新思路,从而为疾病的预防和治疗等提供可靠的科学依据。