结直肠癌相关基因的筛选及转录调控网络的构建

来源 :南方医科大学 | 被引量 : 0次 | 上传用户:pcxuexi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结直肠癌(Colorectalcancer,CRC)是消化道常见的恶性肿瘤,死亡率居发达国家恶性肿瘤死亡率的第3位。在美国,每年有大约50,000人死于CRC,又有148,800的新发病例。CRC发病率在世界不同地区差异很大,发病率最高的是西欧和北美,亚洲、非洲和南美洲的发病率较低。随着饮食结构的变化,近20年来该疾病在我国发病率明显上升,且有年轻化的趋势。其发病率次于胃癌和食管癌,居消化道恶性肿瘤的第3位,已成为日益威胁人们健康和生命不容忽视的疾病。发病年龄以40~70岁多见,男性居多。虽然发病原因尚未完全清楚,研究显示与腺瘤、息肉症、溃疡性结肠炎等有关,但这些因素导致CRC发生的具体分子机制仍不清楚,因此,其治疗手段也是有限的。外科手术切除是现在唯一比较有效的方法,即使这样,在做了外科切除的病人中,仍有相当比例会复发。 由于门静脉系统等解剖生理原因,肝脏成为CRC极易转移的器官。据报道,CRC每年新发病例中1/4-1/3属于晚期,且有50%的晚期病人会发生肝转移,尸检发现肝转移可达60%-70%。CRC肝转移若不经任何治疗,平均生存期仅有6-10个月。因此,肝转移是影响该疾病总治疗水平的一个重要因素。遗憾的是,绝大多数病人确诊时由于肝转移灶过大,与大血管关系及肝内多发转移灶等原因,只有25%左右的肝转移患者适合手术治疗。据目前现状看来,单纯依靠改进手术技巧很难提高手术后生存率,只有通过早期发现肝转移的存在,才有可能尽早地进行治疗,从而提高生存率,改善预后。 基因芯片作为一种高通量、集成化的新兴技术,可同时监测成千上万基因的转录,直接快速地检测出极其微量的mRNA,它是继单克隆抗体技术和PCR技术之后生命科学中的又一重大技术创新,是研究基因功能的重要手段之一,在基因表达谱分析、新基因发现、基因突变及多态性分析、基因组文库作图、疾病诊断和预测、药物筛选、基因测序等领域得到广泛的应用。但得到了基因芯片结果,并不等于获得了信息和知识,如何解读芯片上成千上万个基因点的杂交信息,将无机的信息数据与有机的生命活动联系起来,阐释生命特征和规律以及基因的功能,是基因芯片后期数据挖掘的一个重要方向。 生物信息学是二十世纪80年代末随着基因组测序数据迅猛增加而逐渐形成的一门交叉学科。随着生物学和医学的迅速发展,特别是人类基因组计划的顺利推进,产生了海量的生物学数据,这些数据具有丰富的内涵,隐藏着丰富的生物学知识。充分利用这些数据,通过数据分析、处理,揭示这些数据的内涵,得到对人类有用的信息,将是生物学家和数学家所面临的一个严峻的挑战,生物信息学正是为迎接这种挑战而发展起来的一门交叉学科。具体地说,生物信息学是现代生物学与医学科学和信息科学、计算机科学、生物统计学、数学等学科相互渗透并高度交叉形成的一门新兴前沿学科,最初常被称为基因组信息学,它以获取、加工、储存、管理、检索、分配、分析和释读生物学实验信息为手段,综合运用数学、计算机科学和生物学工具,以达到理解数据中所蕴含的生物学含义为目的。目前,生物信息学已广泛地渗透到生命科学的各个研究领域中,成为不可或缺的重要工具,在人类疾病与功能基因的发现、识别,基因与蛋白质的功能研究方面都发挥着关键的作用,如药物设计、基因多态性分析、基因表达调控、疾病相关基因鉴定、基因产物结构与功能预测、基因进化、基于遗传的流行病学、癌症的遗传机制研究等。 高通量微阵列杂交技术和测序技术的快速发展,产生了大量的基因数据,生物信息迅速膨胀成为数据的海洋。为适应这种高通量基因表达数据的不断增长和人们共享数据的需要,各种数据库应运而生,其中,NCBI(National Center for Biotechnology Information)的基因表达综合数据库(Gene Expression Omnibus,GEO)是世界上最大的储存高通量分子丰度数据的公共数据库,用户可以提交、储存和检索多种形式的数据并免费使用。GEO数据库操作简单,数据全面,免费共享的优势为后期数据挖掘和信息推广提供了良好的平台。 利用基因芯片技术和生物信息学方法系统分析肿瘤相关基因及其调控机制,是当前功能基因组学的重要研究手段。它明显优于过去的单一基因研究模式,可以在整体的、基因组的水平对基因的表达调控网络机制进行系统全面的分析。 本研究以GEO数据库中关于CRC及其肝转移的基因表达谱数据为分析材料,利用BRB-ArrayTools(3.6.0)软件筛选CRC发生及转移的差异表达基因,找出CRC发生和转移过程中均发生变化的基因,对其中进行性变化的基因进行GO基因本体分析,了解其功能分类,并对一功能未知基因进行了结构分析和功能预测;利用PANTHER(Protein Analysis Through Evolutionary Relationships)和KEGG(Kyoto Encyclopedia of Genes and Genomes)找出贯穿该疾病发生过程中的重要生物学通路;最后预测了CRC发生和转移相关基因的转录因子,结合文献挖掘对目标基因及其转录因子构建差异基因相互作用的网络图谱,为CRC的分子发病机制、药物研发及治疗提供有意义的探索和依据。 研究内容主要分为以下两个部分: 第一部分:CRC发生及转移相关基因的筛选。 本章以GEO数据库GSE6988系列中27个正常结直肠组织的样本数据,20个不伴有转移的癌组织样本数据,26对伴有肝转移的CRC原发灶和转移灶的样本数据为研究材料,分别导入BIRB-Array Tools(3.6.0)软件,找出CRC发生相关基因(CRC/正常组织)和转移相关基因(CRC转移灶/原发灶),将两组差异基因进行交叉比较,共同差异表达的基因认为是关于该疾病发生及转移的重要基因,然后对其中进行性变化的基因进行GO基因本体分析和文献挖掘,并预测其中一个功能未知基因的结构和功能;在信号通路方面,同样将两组差异表达基因涉及的生物学信号通路进行交叉比较,以期发现贯穿CRC发生及转移的重要信号通路。 结果: 筛选出在正常肠粘膜经由腺癌最终发展为转移癌的过程中,始终发生作用的基因共50个(上调的11个,下调的39个),在表达下调的基因中,FRZB、KLF4、PDCD4、C10orf99这几个基因呈现进行性下降的趋势;表达上调的基因中,ADAM10、AQP3、MUC4这几个基因呈现进行性上调的趋势。在表达进行性下降的基因中,C10orf99为一功能未知基因,用基因功能分析系列软件对其基因结构、基因组定位、蛋白质结构与功能等进行了初步分析和预测:该基因位于10q23.1,全长835bp,含有3个外显子、2个内含子。最可能的信号肽剪切位点位于第24和第25个氨基酸间,第4-21氨基酸为跨膜区,编码产物位于线粒体或细胞核,有多个功能位点,表明其是一个功能活跃的蛋白质。在正常组织中,肠和卵巢组织表达最高,癌组织中,表达较高的是膀胱癌和皮肤癌。生物通路方面,通过对差异基因进行在线KEGG及PANTHER生物通路分析,发现Wnt信号通路、P53信号通路、细胞周期、血管生成、PI3信号通路、PDGF信号通路等在该疾病的两个过程中都有显著作用。 第二部分:CRC发生及转移相关基因转录调控网络的构建。 对于微阵列数据,获得差异表达基因仅是第一步,但这些差异表达基因的转录调控关系并不能从基因表达谱中分析到,更重要的是如何对这些差异表达基因进行恰如其分的注释,以揭示这些基因在特定条件下的相互关系。转录调控是整个基因表达调控的重要环节,而转录因子与转录因子结合部位的相互作用是这一系统的重要组成部分。本章先利用DAVID软件强大的基因功能注释模块,对第一部分筛选的CRC相关基因进行功能富集聚类,CRC发生相关基因聚为14类,转移相关基因聚为16类,然后用TFME软件预测这些基因集的转录因子,最后用pSTIING、STRING和Genomatix软件对差异表达基因及其转录因子构建基因转录调控网络。结果发现Oct-1、Spi-1、C/EBP家族、Sp1、STAT1、FN1、A2M等几个转录因子和基因在CRC发生和转移过程中出现频率相当高,在基因转录调控网络图中也看到这些转录因子大多位于网络的核心位置。 综上所述,本研究利用生物信息学方法有效地分析了CRC发生和转移的基因芯片数据,发现有些在CRC发生中异常表达的基因(包括上调和下调表达)在转移性CRC中持续差异表达,这些基因在CRC从发生到转移的过程中可能起重要作用,对这些基因从改变的幅度和本身的功能进行更深入的分析探索将是下一步工作的重点;对功能未知基因C10orf99的基因结构、基因组定位、蛋白质结构与功能等进行了初步分析和预测,为下一步实验验证提供了支持和指导;在生物通路方面,亦发现了几条贯穿CRC发生和转移的生物通路,各条信号通路之间可能相互联系、相互影响、相互交叉形成了复杂的有机信号网,共同对CRC的发生起作用;最后分别构建了CRC发生及转移相关基因转录调控网络图,可明确地找出处于核心位置的基因和转录因子。这些研究结果为进一步认识CRC的分子发病机制、药物研发及治疗提供有意义的探索和依据。
其他文献
目的 总结体外膜肺氧合(ECMO)技术在新型冠状病毒肺炎(COVID-19)患者中的应用经验,并分析疗效.方法 回顾性分析2020年1月1日至2020年5月1日本院与合作医院收治的9例接受ECMO
本文简要论述了“任务”和“任务型”教学,结合 D.Nunan的框架理论和笔者的教学实践介绍了任务设计的要素,并 在对“任务型”和传统的课堂教学进行对比实验的基础上进行分析
“学习就是学习如何学习.”就学校教育来说,学生是学习的主体,教师只是教学的教育引导者.学生的“学”和教师 的“教”是相辅相成的,教师的“教”在学生的一生中显然重要但是
目的 探讨对危重症新型冠状病毒肺炎(COVID-19)患者行有创机械通气(IMV)或体外膜氧合(ECMO)干预的疗效及相关危险因素分析.方法 回顾性分析武汉150例实验室确诊的COVID-19危
现在的初中英语写作教学中出现了“蛇尾”的现象,但是因为没有开设正式的英语写作课,以至于现在初中生的英 语写作水平比较低,从而出现了“学生听到写作就烦,看见写作老师就
讲团结是“讲党性、重品行、作表率”的内在要求,也是加强党委能力建设的重要课题。笔者通过近两年来带班子的经历,有以下三点体会。一、强化“荣辱与共”这个理念,用共同的
语言是交际的工具.学生学习英语的目的就是能使用英语进行人际沟通,所以,教师有责任创造良好的语言环境,对学生的听、说、读、写、译等基本技能进行训练,使学生尽可能多地运
紫花苜蓿(Medicago sativa L.)是世界上最重要的多年生豆科牧草,被誉为“牧草之王”。然而,豆科牧草中含硫氨基酸(SAAs)含量很低。含硫氨基酸(SAAs)对动物产毛和产奶的质量影响很大,饲料中补充SAAs,可使羊毛生长和毛中含硫量均显著增加,或提高奶牛产奶量和乳汁中的蛋白含量。利用基因工程手段将富硫蛋白基因转入紫花苜蓿,提高牧草蛋白中含硫氨基酸水平具有十分重要的意义。10KD玉米醇
自从第一个蓖麻毒蛋白Ricin得到分离纯化以来,人们已在多种高等植物中发现了核糖体失活蛋白(Ribosome.inactivating protein,RIP),在真菌和细菌中也有发现。核糖体失活蛋白是一类
语言是工具,学习语言不像理科学习一样,以理解为主.一个外语教师绝不是讲得越多越好,而是要能控制自己的 讲解时间,做到少讲、精讲,适可而止,把时间让给学生,心甘情愿地把主