论文部分内容阅读
随着第二代测序技术的不断进步,人们对各种类型的肿瘤基因组的了解也越来越深入,患者肿瘤的前瞻性临床测序逐步被认为是常规癌症诊疗的一个重要组成部分,癌症基因组测序作为一种重要的辅助诊疗工具已被广泛应用于临床中。然而,如何在越来越多的癌症基因组测序数据中,找出可能对疾病诊疗有影响的体细胞变异等问题,使得准确解释肿瘤关联基因序列变异成为一项严峻的挑战,所以迫切需要一种有效的工具能够帮助研究人员和临床工作者系统地对癌症体细胞变异进行高效而准确的解读。我们根据广泛的文献调研、癌症研究领域专家小组发布的指导意见等,对癌症序列变异解读涉及的各类参考因素进行提炼,构建了基于多等级证据的系统化评估系统,并收集整理可用资源形成本地资料库,将变异位点与基本注释信息、数据库信息、资料库信息等建立联系,并用Java编程语言开发了系统化解读工具Variant Interpretation for Cancer(VIC)。为了用户更方便地使用此工具,还构建了 Web应用平台。本论文的主要工作如下:1)根据科学文献及权威机构发布的癌症序列变异解读指南,提炼出影响体细胞变异对个体健康及临床诊疗应用的各种因素,建立一套基于证据等级的评估系统;2)从公共数据库、各研究小组的独立知识库等大量信息中收集整理可用于解读系统的基因突变与癌症诊疗相关的数据资源,形成本地资料库;3)基于评估系统,制定对证据等级的打分细则,开发了一种能够对肿瘤关联基因序列变异系统性解读的工具VIC;4)基于Spring MVC架构,设计和开发了 Web应用平台;5)将VIC应用到五个不同来源的数据集中进行验证,包括Catalog of Somatic Mutations in Cancer(COSMIC)数据库数据、cBioPortal平台中下载的29例小细胞肺癌患者的变异数据集,the Database of Curated Mutations(DoCM)资料库收录的已知致病性变异数据集、The Cancer Genome Interpreter(CGI)提供的实例应用数据集,以及BRCA1/2全外显子测序数据集。COSMIC数据集中被VIC评估为“致病性/可能致病性”的变异数量远低于COSMIC数据库中标记的致病性变异数量,这一结果说明了临床应用不能只依赖于单一工具单一标准的评估结果,本研究中综合多个工具的预测结果使得评估结果更可靠。通过比较不同工具对29例小细胞肺癌患者样本测序数据集和来自CGI平台四个应用实例数据集的评估结果,表明了本研究建立的多等级评估系统涉及到多方面参考因素,因此对变异位点的致病性及临床应用意义的解读结果比其他工具的评估结果更加保守。根据对DoCM资料库中1364个已知致病性变异位点的分析结果,我们进一步比较不同的注释工具导致的差异及不同评估系统的偏向性差异,说明了多维度评估系统在解读变异位点对疾病治疗、诊断等方面具有临床应用前景。在35例BRCA1/2全外显子测序数据中找到两个解读结果为可能致病性的变异位点,在临床应用中可以作为参考意见。本研究中建立的多等级评估系统涉及了生物标志物应用、生物学信号通路、突变类型、靶向药物等多维信息,通过数据集测试,表明该系统在评估变异位点的致病性以及是否具有临床应用意义上,均能够对癌症序列变异进行更可靠评估与解读,开发的工具能够为更多研究人员对肿瘤测序数据中的体细胞变异解读提供新的方法,本研究对促进DNA测序技术在肿瘤诊断和治疗等临床领域的应用具有重要价值。