基于ME算法搜寻引起一类肺癌的驱动基因

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:rocwingw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
恶性肿瘤在世界范围内的发病率和死亡率越来越高,给患者本人以及社会都造成了极其严重的影响。癌症驱动基因的突变对肿瘤的形成和发展起到极其重要的作用。驱动基因的预测在对疾病的理论研究和患者的临床诊疗方面都有重要的意义。但由于疾病自身的复杂性,还有现阶段对疾病的实验手段和计算方法的限制,所以对于驱动基因的准确预测仍然是个难题。本文基于ME互斥算法将肺癌的基因表达数据和基因本体论即GO功能注释结合,来预测肺癌样本中发生突变的驱动基因。我们首先建立模型,通过三倍差异识别肿瘤样本的基因表达谱数据中的差异表达基因,再以所得的差异表达基因为基础,依据GO功能注释找到功能一致的基因和肿瘤的集合,构建了肺癌相关基因的差异表达子集,接下来用超几何分布计算突变基因和拷贝数变异基因与所选肿瘤的相关系数,最后应用ME算法选择相关系数最小的,即在肿瘤和正常样本下显著差异的,且覆盖肿瘤数最多的基因作为结果。最终我们的模型得出了与肺癌发生和发展密切相关的驱动基因的预测集。我们把结果与已发表的生物实验结果进行比较分析,发现有些基因是已知的癌症驱动基因,并且我们发现我们得到的预测集中有大量基因已经被证实与相应的癌症类型有密切的相关性且对于癌症的发生和发展起到重要的推动作用。所以我们的研究对于以后的疾病模型的建立和疾病的治疗等都具有重要的意义,并且能够对以后研究肺癌的疾病机制和后续治疗提供科学有效的方法。
其他文献
平板显示器、太阳能电池、发光二极管、气体传感器、节能玻璃等光电器件的广泛应用进一步扩大了透明导电薄膜的市场需求。目前应用最多的是ITO薄膜,但是ITO薄膜主要成分In是
缺失数据作为复杂数据的一种,在生物医学、教育学和经济学等研究领域中普遍存在,目前国内外大部分对于数据缺失问题的研究都是基于数据缺失机制为可忽略的情况下。但一些实际
谐波是电力系统中的有害物,是电力系统中的一种能量污染。谐波不仅造成电网污染,影响线路的稳定,而且会对电子设备产生一定的污染,导致电子设备不能正常运行。而且,谐波对人
作为传统计算模型的电子计算机,计算速度逐渐地接近瓶颈。为解决计算的瓶颈问题,科学家们对计算模型进行了大量的研究,其研究的领域中最具代表性的就是自然计算。作为自然计
路灯是为道路提供照明功能的灯具,它可改善交通条件,减轻驾驶员疲劳,有利于提高道路通行能力和保证交通安全,还可美化市容,在城镇道路以及高速公路上得到广泛使用。随着使用年限的增加,工业尾气、自然污染物会附着在路灯表面,造成路灯的透光性降低,影响交通安全。由于路灯悬空高度高,人工清洗方式费时费力、且存在人员安全问题。因此,迫切需要开发机械化的路灯清洗装置,同时对路灯进行识别和定位,获取路灯的位置信息,进
现今我国国民经济发展速度放缓,为了能够更好的实现对国民经济发展的有效推进,为民众创造出更多的就业机会,在近年来的发展过程中,政府对于小微企业发展给予了诸多支持,以推进小微企业发展。但是,受制于自身规模等方面因素的限制,进而导致小微企业常常会出现融资困难的问题,进而影响了其快速发展,为了促进小微企业发展,国家鼓励发展普惠金融,要求银行业等金融机构加大对小微企业的资金支持,因此银行如何进行小微企业信贷
作为一种分泌性糖蛋白,颗粒蛋白前体(Progranulin,PGRN)包含一个由17个氨基酸残基构成的分泌信号肽以及7.5个高度保守的半胱氨酸衔接重复结构域,这些结构域被分别命名为 para
近年来,随着人工智能技术的发展,需要处理的问题规模越来越大。然而,电子计算机模型计算能力的发展速度正在逐渐放慢,使得人工智能技术在求解大规模问题时遇到的计算能力方面
本文提出向前可加回归方法(Forward Additive Regression)来解决超高维非参数可加模型的变量选择问题,超高维问题下的维数pn=O(exp(nα)在超高维数据中,自变量的个数远大于样
面源污染造成的水污染已经成为我国水资源和水环境的主要问题,湟水流域作为黄河上游青海省境内的最大一级支流,也面临着面源污染问题。面源污染面积大,分布广,随机性高,且难以监管,研究面源污染过程需要综合考虑自然地理,气象水文,土地利用及社会经济各方面因素。目前,土壤水文评价工具(SWAT)被广泛用于面源污染的研究,且有在全球各大流域范围内得到了很好的模拟结果和推广应用。为了减少湟水流域的污染物流失,提高