论文部分内容阅读
肺癌是最常见的人类恶性肿瘤之一,也是我国高发恶性肿瘤之一。世界范围内,肺癌致死率在所有癌症中为最高。从1985年以来,随着人类工业社会的不断发展,肺癌的发病率不断上升,肺癌致死人数超过乳腺癌、前列腺癌和肠癌致死人数总和。中国是世界上肺癌患者最多的国家,每年确诊人数超40万,而且仍处于不断上升状态。肺癌已成为一个影响我国人民公共健康的严重问题。大量研究表明肺癌发病与吸烟密切相关,世界卫生组织1995年的调查报告显示,近70%的肺癌患者有吸烟经历,其中又有80%的患者烟龄超过10年。主动或被动吸烟已成为肺癌发病过程中重要的外部环境因素。但是,科学界对于肺癌发病的遗传学因素仍然不是十分清楚。人类基因组变异包含单核苷酸多态性(single nucleotide polymorphism,SNP),拷贝数变异(copy number variations,CNV)等。其中拷贝数变异是指的基因组中大于1kb长度的DNA片段的扩增,缺失以及更复杂变异导致的DNA拷贝数变化。相比较SNP占人类基因组中0.5%的比例,人类基因组中近12%的区域经常发生拷贝数变异。拷贝数变异已经成为一种重要的基因组变异,其在人类复杂疾病发病过程中的作用仍在不断揭示中。本课题着眼于肺癌发病的遗传学机理,通过对肺癌病人的全基因组拷贝数变异进行分析,深入研究拷贝数变异在肺癌发病过程中的作用。我们收集了总数近5500的欧美人全基因组DNA阵列芯片数据,包括EAGLE(Environment And Genetics in Lung cancer Etiology)和PLCO(Prostate,Lung,Colorectal and Ovarian)和两套数据。我们设计了一种全新的分析策略,包括基于SNP单位点的关联分析(SNP-based testing),基于window的聚类分析(window-based cluster testing)和两套独立数据混合分析(combined analysis)三个阶段。最后,我们确定了167个潜在的SNP位点和22个CNV与肺癌发生相关联。进一步的分析表明我们的结果得到了其他研究的支持,为肺癌研究提供了潜在候选位点。