基于基因网络模型分析的癌症驱动基因识别算法研究

来源 :杭州师范大学 | 被引量 : 0次 | 上传用户:xinhua163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症已经成为全球主要的公共卫生问题,同时也是主要的死亡原因之一。其中,癌症驱动基因的挖掘一直是一个重要的研究方向。同时,基于驱动基因的精准医学也是治疗癌症的重要手段。随着基因测序技术的进步,在过去数十年中已经报道了数以百万计的体细胞突变。但从这些数据中挖掘具有致癌突变的驱动基因仍然是一个极具挑战性的研究课题。为此,已经提出了许多高级算法来识别驱动基因,而在海量数据中将网络结构信息与生物信息相结合的尝试鲜有出现。本文基于复杂网络与机器学习方法研究癌症驱动基因的挖掘,创新性地结合了多种特征提取和对比分析的方法,分别从基因网络特征、基因属性特征、网络与属性的整合特征三方面综合挖掘基因特征,并通过不同角度的对比分析论证研究的可行性。最后,基于随机森林改进优化分类,揭示影响癌症发生发展的重要因素,进而识别出真正的潜在癌症驱动基因,为指导癌症的临床研究和驱动基因的挖掘提供指导依据。主要工作包括:(1)基于复杂网络理论的癌症基因网络分析。构建癌症基因网络,分析网络结构在癌症发生发展过程中的变化情况和挖掘基因的网络特征是本论文最先要研究的问题。对网络结构的分析,分别对比了Normal网络与Tumor网络中驱动基因的网络结构变化情况和驱动基因的连边机制,以及Tumor网络中驱动基因与非驱动基因的特征值分布情况。(2)基于复杂网络与机器学习方法的癌症驱动基因预测。癌症驱动基因挖掘算法的研究是本论文的另一个重要问题。该模块主要是对单个特征的重要性、结构特征与非结构特征的重要性、使用基因网络与未使用基因网络的差异,以及模型的预测结果进行研究分析。对7种不同类型癌症驱动基因的挖掘结果显示,论文提出的算法总是可以达到很高的预测准确性,模型的AUC得分分别是0.987、0.991、0.994、0.995、0.989、0.989和0.986,并且预测结果与癌症基因普查(Cancer Gene Census,CGC)数据库的重叠比例能够达到40%及以上,均优于现有的先进方法。进一步的分析也表明,整合网络特征有利于癌症驱动基因的挖掘。
其他文献
小儿胸餐伤,由于年龄小,不能直接反映病情及外伤经过,不配合,胸部解剖和生理特点与成人不同,给护理工作带来诸多困难,影响创伤愈合。1982年5月-1996年5月,我院胸外科收治小儿胸外伤23例,其中多根多
党的十八届六中全会聚焦全面从严治党这一战略主题,围绕加强和规范党内政治生活、加强党内监督出台规范性文件,是推进全面从严治党、开创党的建设新局面的行动纲领。学习好、贯彻好中共十八届六中全会精神,最终要落实到干事创业工作之中,用实践检验贯彻落实中共十八届六中全会精神成效。  一、守规矩、成方圆,加强和规范党内政治生活  开展严肃认真的党内政治生活,是我们党的优良传统和政治优势,是全面从严治党的重要抓手
利用多菌种混合发酵同时处理泔脚和秸杆2种废弃物,提出了一种生产高蛋白饲料的新工艺流程,并且对该流程初步进行了经济估算。结果表明,在泔脚和稻草秸杆粉按3:1,温度150℃、高压锅
对传统的模糊数学法进行了改进,并将其用于城市生活垃圾处理方式的决策评价中。针对上海城市生活垃圾规模处置系统可能有的3种方案分别构造矩阵,求出评价值。结果表明,改进后的
天津地铁2号线某区间土压平衡式盾构在全断面⑤2层粉砂土条件下进出洞,由于周边环境复杂,施工具有较大难度及风险,经采取多项施工措施进行风险控制,盾构顺利进洞。
上海虹桥综合交通枢纽西航站楼部分外墙采用清水混凝土挂板。介绍了预制清水混凝土外墙挂板的设计、预制和安装技术,确保了混凝土颜色、表面观感质量符合清水混凝土饰面的要求
在新时代,马克思主义大众化的实现路径问题依旧是国内学术界研究的重点。学术界主要围绕“马克思主义大众化历史路径选择的研究”“马克思主义大众化现实路径选择的研究”“
汽车用车桥板是载重汽车承重的主要材料,其表面质量直接影响防腐涂漆效果,从而影响载重汽车在整个服役周期的稳定性。本文以汽车用车桥板上所覆盖的氧化铁皮缺陷为研究对象,通过实验室分析,明确了缺陷的物相组成。根据分析结果,找到了现场所对应的工序环节,并通过针对性的试验,进一步明确了工艺参数范围,实现了无氧化铁皮缺陷车桥板的批量生产。通过金相、扫描电镜、XRD衍射仪分析,正常状态下氧化铁皮厚度为20μm,F
研究了沸石、沸石-石灰石、石灰石3种填料的人工湿导的净化能力。结果表明:(1)沸石和石灰石混合使用,不会降低沸石吸附氨氮的能力;(2)沸石可促使难溶性P的释放,使得石灰石吸附P被植物