癌症驱动错义突变预测方法的比较分析和性能提升初步研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户：big_moth123

【摘要】

：

【作者】

：

孙海洋

【出处】

：

安徽大学

【发表日期】

：

2019年07期

【关键词】

：

癌症驱动突变乘客突变错义突变机器学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

癌症作为一种人类复杂遗传疾病,一般是由基因组上不断累积的大量突变所导致。在众多突变中,仅有一小部分突变对于癌症的发生发展起到关键作用,这些突变被称为驱动突变。驱动突变的发生会显著改变正常细胞的分子运行系统,并且刺激肿瘤细胞的生长。由于癌症基因组的不稳定性,通常驱动突变的发生会伴随着大量的乘客突变,这些乘客突变一般不会参与癌症的发生发展以及治疗等过程。考虑到驱动突变是作为癌症的诊断和预后的分子标志,并且是癌症相关药物的研发或者作用的靶标,所以从癌症基因组上众多的突变中识别出驱动突变是非常重要的。错义突变是基因组上数量最多的一种突变,目前已有多种策略用于预测癌症驱动错义突变。第一种策略是通过传统生物学实验方法鉴定驱动突变,但是比较耗时耗力,难以处理和挖掘众多测序项目产生的海量突变数据。第二种策略是通过统计学方法发现驱动突变,但是需要较大数量级的癌症样本,一般难以获取到。最后一种策略是基于序列位点保守性,蛋白质结构与功能等特征开发相关算法,预测对癌症发生发展有功能影响的驱动突变。目前已经有很多算法用于预测癌症驱动错义突变,这些预测算法有着不同的设计特点。已有的关于癌症驱动错义突变预测算法评估性研究工作指出不同类别预测算法存在着预测偏向性问题,并提出了集成不同预测工具的解决方案,但是没有对造成不同预测工具预测偏向性的原因进行深层次地分析。通过标准测试集(癌症相关、有代表性、非冗余)上的实验结果,本文参照模型的设计方法系统地对不同类别的突变预测工具的预测性能进行了评估和分析。根据评估结果,构建了基于高质量负样本的癌症驱动错义突变预测模型。本文的主要工作如下。1.分析比较了现有错义驱动突变预测工具,在多套标准测试集的预测结果表明,癌症特异性突变预测工具比广谱性疾病突变预测工具对负样本预测性能较差。本文共获取34种错义驱动突变预测工具(包括5种保守性分数预测方法),基于6套标准测试集对这些突变预测工具的预测性能进行了比较分析。根据对癌症特异性突变预测工具和广谱性疾病突变预测工具的评估,癌症特异性突变预测工具相比广谱性疾病突变预测工具表现了较低的综合预测能力,主要原因是其对负样本的预测能力较差,有待提升。2.提出了一种基于高质量负样本数据集的驱动错义突变预测方法,建立了驱动错义突变预测模型CMMPred(Cancer Missense Mutation Predictor)。训练集的正样本和负样本分别来源于COSMIC和dbCPM数据库。借助CRAVAT工具,本文为所有样本编码生成85维特征,并基于XGBoost算法建立了CMMpred模型。在独立测试集上,CMMPred的AUC、Sensitivity和Specificity分别为0.77、0.75和0.66,比紧随其后的PolyPhen2工具在AUC上高出7个百分点,表现了比其他所有工具更好的综合预测能力。实验结果说明经过人工注释的高质量乘客突变有效提升了癌症驱动错义突变预测性能。

其他文献

关于农村合作金融体系的构造

关于农村合作金融体系的构造●符进喜农村合作金融体系是我国金融体系的重要组成部分。构造我国农村合作金融体系，是发展农村市场经济的客观要求，是我国金融体制改革面临的重大

期刊

农村合作金融机构合作金融体系农村合作经济组织农村信用社农村合作银行资金互助村“两会”我国农村组织形式人民银行

保守治疗与切开复位内固定术治疗多发肋骨骨折疗效的系统评价

目的:为全面性分析阐述传统保守治疗与手术切开复位内固定术对多发肋骨骨折疗效的意义。方法计算机检索PubMed、EMbase、The Cochrane Library、Web of Science、万方数据库、中国知网和维普数据库,筛选关于研究切开复位内固定术与传统保守治疗多发肋骨骨折效果的随机对照试验(RCT)和队列研究(CO)的文献,从各数据库建库至2017年12月。由两位研究者分别检索、收集资

学位

多发性肋骨骨折切开复位内固定术胸壁畸形发生率系统评价外科手术

针灸学图表解多媒体课件在针灸教学中的应用

针灸学是中医学的重要组成部分，针灸学包括：“针灸发展史、经络学、腧穴学、针法灸法学、针灸治疗学”。我们西医学院本科学生理论课12学时，实习课4学时，口腔本科学生理论课为32

期刊

针灸学多媒体课件针灸教学

hs-CRP与Alb的比值在评估接受无创通气治疗的AECOPD合并呼吸衰竭患者预后中的应用价值

目的:探讨超敏C反应蛋白(hs-CRP)与白蛋白(Alb)的比值在评估接受无创通气治疗的AECOPD(急性加重期慢性阻塞性肺疾病)合并呼吸衰竭患者预后中的应用价值。方法:选择2015年2月

期刊

慢性阻塞性肺疾病呼吸衰竭无创通气超敏C反应蛋白/白蛋白的比值

对新形势下央行加强存款监管的对策研究

对新形势下央行加强存款监管的对策研究●赫成尧一、金融机构之间不正当存款竞争的表现及危害金融同业竞争中确实存在违法违规现象，在存款业务方面的表现主要有：１．乱发纪念品或手

期刊

非银行金融机构对策研究新形势高利率企业存款储蓄存款公款私存人民银行企业单位手续费

64层螺旋CT自动曝光控制技术在患者腰椎扫描辐射剂量控制的探讨

64层螺旋CT问世以来极大的拓展了CT的临床应用的范围，腰椎的64层MSCT的检查方法已经从常规的固定管电流（毫安秒，mAs）的椎间盘序列扫描发展到现在的全部椎体的容积扫描。容积扫描

期刊

CT剂量指数辐射剂量体层摄影术X线计算机腰椎

20世纪上半叶西康地区职业教育研究

20世纪上半叶，西康地区的职业教育可以分为两个发展时期，一是清末的萌芽时期，一是民国特别是抗战爆发后的发展时期，并指出西康地区职业教育的发展特点：以政府为主导推动；因地制宜筹

期刊

20世纪上半叶西康地区职业教育

大力拓展中间代理业务开辟效益新增长点——工商银行海口市分行发展中间代理业务的做法与体会

工商银行海口市分行在金融业竞争日趋激烈的新形势下，没有把存款工作停留在以往的你挖我转、你夺我防的无序竞争上，而是审时度势，及时调整战略，充分发挥电子化网络覆盖面广、服务

期刊

中间代理业务新增长点海口市工商银行证券市场法人清算电话费清算业务中间业务海南

金融大法利剑高悬金融改革奋马扬蹄──《商业银行法》学习座谈会概述

金融大法利剑高悬金融改革奋马扬蹄──《商业银行法》学习座谈会概述王红月３月１８日，《中国人民银行法》的颁布，如同久旱大地上的一声春雷，打破了中国金融大法十余年＂千呼万唤不出来

期刊

《商业银行法》中国金融改革座谈会国有商业银行金融体制改革比例管理法制环境《中华人民共和国商业银行法》资产负债信贷资产质量

严肃结算纪律强化结算管理迅速实现我省结算秩序的根本好转

这次全省结算工作会议,是落实全国结算会议精神、进一步整顿金融秩序、深化金融改革的一个重要步骤,是全面深入贯彻今年金融工作方针的一次重要会议。会议的指导思想是:坚决

期刊

金融机构结算管理结算纪律人民银行银行汇票根本好转银行结算同城票据交换结算工作票据交换所

癌症驱动错义突变预测方法的比较分析和性能提升初步研究

与本文相关的学术论文