基于癌症基因组数据的癌症驱动基因识别方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:kingduli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症作为威胁人类生命健康的一种重大疾病,癌症相关领域的研究仍然是生物信息学方面的研究热点。大量研究证明,在癌症进程中,起到了决定性的作用的关键基因只有少数,因此癌症基因组研究的关键任务是识别驱动突变或驱动基因。基因组中功能相关的驱动突变的基因集,也被称为驱动模块或通路,激活癌症发生的机制,触发癌症,并使癌细胞具有选择性优势。因此,准确识别出癌症的驱动基因,能帮助临床医生对癌症更精确的诊断,对有效治疗癌症具有重要意义。本文基于癌症基因组数据对癌症驱动基因识别进行研究。对于癌症驱动基因的识别的研究方法根据所使用的输入数据类型,可以分为以下两类:1)“从头学习”的方法仅仅依靠基因数据作为输入数据,来发现新的基因相互作用,与癌症相关的驱动基因2)基于知识的方法,除基因组数据外,还以通路、网络和功能表现型的形式,结合先验知识来识别驱动基因。本文中主要研究的方法是后者。下面对本文的主要工作进行介绍:1)提出了一种基于社区检测的癌症驱动模块识别的方法(CMBCD),该方法以蛋白质间相互作用(PPIs)、互斥性和覆盖性整合连接信息,递归的运用Louvain算法来识别癌症驱动模块。在识别已知癌症基因方面,CMBCD优于TCGA泛癌数据上的几种先进的计算方法,提供了能够对正常和肿瘤样本进行分类的模块,并富集在特定癌症类型突变上。CMBCD能识别了包含已知癌症基因和在泛癌症数据中罕见突变的基因的基因模块。2)提出了一种基于多任务学习的癌症驱动基因识别方法(CDGBML),利用体细胞基因组数据,结合基因组信息和先前的生物知识,通过多任务学习模型准确地预测癌症驱动基因的优先级。通过对不同的数据集进行测试,实验结果表明,CDGBML的性能足够好,优于现有的几种方法,是一种准确且易于使用的癌症驱动基因排序方法,可以帮助提高癌症驱动基因预测和优先级的准确性,从而促进精确诊断、个性化治疗和更好的临床判断。综上所述,本文基于癌症基因组数据对驱动基因识别问题进行研究,提出两种有效的识别模型和算法。实验结果表明,本文提出的模型和算法,确实能够识别出一些具有生物学意义的驱动模块和基因。
其他文献
智能可穿戴电子设备(intelligent wearable electronic devices,IWEDs)已经广泛应用在日常生活中,且IWEDs朝着轻量化和柔性化的方向发展。传统集流体集成的微能源器件(micro energy devices,MEDs)过于刚性和体积庞大,显然不适于便携使用。此外,IWEDs的迅速发展促生了一体化多功能的集成MEDs,即在原有功能(储能+可穿戴)基础上,集成
近年来,繁简分流改革在全国地方各级人民法院大力推广。多数既有研究和实践经验表明,“简案快审、繁案精审”的繁简分流成效显著,能够提高司法效率、促进司法公正,繁简分流已经成为了破解“案多人少”矛盾的主要方式。但是,既有研究和实践经验都没有通过详细的审判数据予以论证。本文通过A法院的详细审判数据,结合繁简分流的理论基础——比例原则,比较了繁简分流前后的司法效率和司法公正,发现:投入20%-30%小比例的
作为最广泛使用的能源之一,电能在社会经济建设和人民日常生活中起着至关重要的作用。随着社会经济的发展,各行各业对电能的需求也在不断提升。然而,部分用户在利益的驱使下通过窃取电能节省耗电成本,对国家的经济造成了巨大损失。尤其近年来随着虚拟货币价格的飙升,更是有许多用户通过窃电进行虚拟货币“挖矿”谋取私利。高级量测体系(Advanced Metering Infrastructure,AMI)的广泛建设
在自然科学和社会生产运作中,会涉及到大量的决策,决策帮助我们在大量不确定的情况下,选择最有利于我们的决定。一般而言,我们在解决某一问题或者实现某一目标时,通常有多个行动方案,而决策的过程就是选择一个具体的行动方案,并付诸于行动。在决策时,决策者可以根据自身对事物的认知来下决定,同时也可以根据以往事件的发展方向来下决定。而想要决策结果更利于自己,则需要使用专业的预测方法。长久以来,大量问题的决策离不
全球市场处于激烈的竞争中,许多公司因此兴旺发达,以正确的质量,价格和在正确的时间交付给客户的方式生产优质的产品。拥有正确实施的系统的公司从长远来看有很大的机会在市场中生存,反之亦然。坦桑尼亚当地制造业的成活率非常低,文献综述中报告了许多原因,但是,造成这一技术原因的主要原因是缺乏实施世界一流的制造系统(如TPM)。有效实施TPM不仅可以提高公司的OEE,还可以减少并消除不必要的运营成本。本案例研究
燃料电池由于比能量高、发电效率高、燃料范围广及环境友好等优点而受到广泛的关注,但其成本高及电极反应速率低等问题也限制了燃料电池的大规模应用。燃料电池电极反应速率低主要是由于阴极氧还原反应(ORR)的动力学速率缓慢及能量转化效率低下,因此需要高效、稳定的电催化剂来解决这一问题。贵金属铂系催化剂是目前最常用的催化剂,具有显著的ORR催化活性,可以有效降低ORR活化能,是唯一实现商业化的催化剂。但金属P
本文立足学位论文学术规范角度对汉语国际教育硕士学位论文以云南大学文学院(2011-2016)为例,用辩证思维透过特殊性认识普遍性,力求从云大文学院汉硕学位论文学术规范特殊现象,以小见大反映汉语国际教育专业硕士学位论文学术失范现象一般特征。笔者运用调查法、案例分析、数据统计等研究方法对学位论文中学术规范体现情况从形式到内容进行总体考察,以客观陈述学位论文学术规范发展现状为目的,呈现一份以年份为跨度本
稻瘟病(Rice blast)是具有毁灭性的一种水稻真菌性病害,对水稻的生产安全造成严重威胁,被称为水稻的“癌症”。有效防治稻瘟病对水稻的稳产具有重要的意义,目前抗性品种的选育和合理布局是经济性且环境友好型的稻瘟病防控措施。因此,挖掘更多抗性基因对于抗性品种的选育具有重要价值。拟南芥类受体蛋白激酶FERONIA(FER)在生长发育、免疫及逆境响应等生物过程中发挥作用,在水稻中,受体蛋白激酶FLRs
随着现代社会人们进行室内活动所需要的时间不断提高,人们对位置服务的需求也不断增加。由于房屋建筑等障碍物的阻挡,室内环境的复杂多变等各种方面的影响导致了卫星信号不能够支持室内的定位要求,因此不依赖外部信号的行人航迹推算定位技术已经受到广泛关注和研究。行人航迹推算定位技术不再依靠外部设备提供支持,仅仅依赖自身的惯性传感器采集得到的数据,因此很大程度地改善了室内位置服务的服务质量。本文的主要工作内容是针
乡村振兴战略施行之后,农村村居环境得到了国家层面的重视,虽然“防治农村面源污染,整治农村人居环境”在十九大报告中被明确提出,但由于我国长期对城市和农村的关注与投入的不同,农村的村居环境则一直未被重视起来。治理村庄环境是一个系统的工程,仅仅依靠基层政府的主导性治理,难免难起到立竿见影的效果。协同治理理论正是为针对政府部门的失败以及公共的跨界问题而出现的理论范式,其目的也是为整合政府主体和镇域内相关参