抗癌药物敏感性突变标记物的数据库构建及其预测方法研究

来源 :安徽农业大学 | 被引量 : 0次 | 上传用户:a8058058
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因检测技术的发展和癌症靶向治疗的增加有助于实现肿瘤学领域的精准医学,但目前癌症精准医疗数据的碎片化和异质性给组学数据的临床解释、复杂突变标记物的识别和突变-药物反应预测模型的开发等研究带来了困难。随着数据挖掘技术和人工智能的发展,将这些新技术应用于医学领域,挖掘出数据中有价值的信息才能真正地发挥精准医学前所未有的能力。针对癌症药物敏感性数据的复杂性、多特征性以及多变性特点,一个信息完善且准确的数据库对于设计出能有效预测突变与药物反应模型是必不可少的。高性能的预测模型可以实现精准指导多种癌症类型的药物治疗,避免不必要的经济损失和治疗损失。通过数据挖掘和人工智能技术相结合,本文构建了一个公共数据库以促进资源更好地扩展和利用,同时基于机器学习对抗癌药物敏感性预测问题展开了研究。主要研究内容如下:(1)构建了一个抗癌药物敏感性突变标记物数据库,并命名为db MCS,(http://bioinfo.aielab.cc/db MCS/)。本研究主要从Pub Med检索的文献中整理出突变标记物以及抗癌药物敏感性关联数据,使用注释工具统一各类数据名称并且标准化基于不同参考序列的变异描述,同时确保了数据的完整性和准确性。目前,db MCS包含4427个突变-疾病-药物相关联的数据,其中敏感性和耐药性条目分别为3151个和1276个。(2)分析了药物敏感性错义突变与中性突变在基因、DNA、蛋白质、转录本四个层面上的生物学特征。利用置换检验、Wilcoxon秩和检验、Fisher精确检验的统计学方法探讨了生物学特征之间假定的显著性关联,结果表明发生在DNA序列的高保守区域和蛋白质结构域内的突变标记物往往对癌症进程具有重要影响。(3)开展了基于五种机器学习的抗癌药物敏感性预测模型的比较研究。提出区分有药物反应的突变和中性突变的二分类问题,以及区分药物敏感性突变、耐药性突变和中性突变的三分类问题。对于二分类问题,基于SVM算法的预测模型具有良好的表现(AUPR=0.90,AUC=0.92);对于三分类问题,基于XGBoost算法的预测模型表现较好(AUPR=0.81,AUC=0.88)。这表明db MCS是一个可靠的数据集,可以对未来的癌症药物基因组学研究提供新的见解和必要的线索。
其他文献
传统技艺类非物质文化遗产是我国非遗项目中的重要组成部分,作为中华民族劳动人民思想与智慧的结晶、民族记忆与民族历史的浓缩,它是在历史演变进程中由各个民族或者地区所掌握的具有基层风貌的精神生活、意识形态、文化价值,具有高度技巧性与艺术性,承载着发扬民族精神、传递价值观念、提升道德素养等多种文化功能。“痘姆陶器烧制技艺”与“桑皮纸制作技艺”是潜山市具有代表性的两项国家级传统技艺类非物质文化遗产。本文以二
学位
在电子商务飞速发展的今天,其过程中暴露出的隐私保护问题也逐渐凸显出来,并正在成为国内外炙手可热的研究课题。当前,电子商务领域消费者隐私信息被公开、个人数据资料未经授权被收集和利用等违法行为屡禁不止。因此维护消费者隐私权益,整顿电子商务行业不良之风已成为十分必要的举措。本文以当下热议的电子商务隐私保护问题为出发点,从平台和用户两方面开展相关研究。首先,本文通过了解中国电子商务平台如何实施数据隐私的七
学位
基于乡村旅游推进乡村振兴进程加快、文旅融合深入发展的背景,各地区为促进本区域的经济发展,越来越注重通过对文化资源的开发利用来发展乡村旅游业。潜山市有着丰富的人文历史资源、自然资源,以及社会资源等,在发展乡村旅游业上有着得天独厚的优势,潜山市有着著名的“山水资源”,其中“山”为天柱山,“水”则为张恨水,对比天柱山资源较完整的开发,张恨水文化资源开发尚未完善,将张恨水文化资源进行开发利用,有利于进一步
学位
随着新一轮科技革命深入,我国数字经济飞速发展。近年来,辽宁提出“数字辽宁、智造强省”发展战略,大力发展数字经济,辽宁产业数字化发展不断取得新突破,数字经济在三次产业中的渗透率不断提升,取得了一定的成就。但是在数字产业发展和产业数字化转型过程中,仍然面临了很多问题亟须解决。本文立足辽宁数字经济发展现状,探究数字经济发展面临的问题,并提出对应的对策建议,以期破解辽宁振兴发展难题、推动形成竞争新优势、实
期刊
中国是传统的农业大国,近年来中国的农业进出口总值不断增长,而植物病虫害识别是农业生产中的一个重要问题。人工识别与传统计算视觉的方式很难适应复杂变化的实际应用场景,而卷积神经网络模型能够通过参数优化来适应各类任务,所以需要研究基于卷积神经网络的植物病虫害识别算法。文章基于现有的植物病虫害图像数据,首先使用传统的卷积神经网络模型来对迁移学习方法在植物病虫害细粒度分类任务上的有效性进行了验证;随后使用基
学位
某选矿厂为实现提高产量和回收率的生产目标,达到节约成本、改善工人劳动条件的目的,针对选矿厂的全工艺流程进行了自动化改造,设计了一套选矿自动化控制系统,通过PROFIBUS现场总线远程控制生产现场设备的启动、停止,同时采集生产现场数据,自动调整生产过程中的工艺参数,可使选矿能耗降低,产量与经济效益提高。
期刊
随着互联网技术和信息服务的飞速发展,互联网上充斥着大量的冗余信息,这导致了严重的信息过载问题。由于互联网信息快速、实时、海量地生成,用户越来越难以从海量信息中准确获取与自己兴趣相匹配的内容,因此,研究个性化推荐系统就显得十分必要。早期的推荐系统,仅通过简单的物品销量、话题的点击量或新闻的阅读量等策略对互联网的信息进行排序,然后选取靠前的物品推荐给用户,这与推荐系统用户推荐他们感兴趣的相关项目或服务
学位
体育是发展其他教育项目的基础,体育教育可以为学生培养一个健康的体魄,坚强的意志。因此,各大高校应该注重对学生体育的教育,既有利于培养学生的健康身体,也有利于促进学生的全面发展。下面就针对如何更好地进行体育教学进行探讨。
期刊
最近几年,中国的建筑行业整体面临转型。在此背景下,建筑施工现场管理水准有所提高。但不容忽视的是,在当前的建筑工程项目施工时,依旧存在比较多的问题。因存在上述问题,在一定程度上影响了建筑工程项目管理的施工品质、工程进度以及施工工序。进而导致安全事故发生。这种情况在极大程度上威胁了工作人员的人身安全。在此同时也会对建筑企业造成一定影响。可见,利用有效方式全面提升现场管理工作质量格外重要。结合实际情况,
期刊
当前,工程项目在管理中仍然存在着工程进度缓慢以及效果较差的问题,在施工中也经常发生安全事故,这不仅会对建筑单位经济利益造成重大损害,对建筑单位长久的发展也非常不利。现阶段,不少施工单位已经清醒的认识到了现场管理中所存在的一些不足,并采取相应的措施进行应对和解决,取得了不错的成绩,在某种程度上还提高了工程项目管理的水平。然而由于受到多个方面因素影响,导致现场管理中依然存在着一些问题和不足,基于此,文
会议