论文部分内容阅读
胃癌,高居世界肿瘤死亡率第二位,而影响胃癌治疗疗效的关键因素在于多药耐药。胃癌耐药的发生机制复杂,是涉及多个蛋白编码基因、多条信号通路的复杂调控网络共同作用的结果,针对任何耐药相关分子的单一干预都难以有效逆转胃癌耐药。基因表达,作为细胞生命活动的一个最基本过程,其内容可概括为DNA转录为m RNA,然后再翻译为蛋白质,而转录阶段则是基因表达的核心步骤,所以一个基因表达的成功与否大大取决于转录阶段,这也因此突显了m RNA的重要性。本梯队合作单位第四军医大学研究发现,在胃癌耐药细胞中存在着大量异常表达的m RNA,并通过对这些m RNA表达水平的测量,得到了大量差异表达基因数据,而这些差异表达的基因数据为胃癌多药耐药研究提供了重要线索。但胃癌耐药中特异表达的基因数量众多,单纯依靠传统生物实验逐条敲出、抑制的研究方法消耗大量时间、物力,且不具有良好的可操作性。生物信息学则可以通过合理的数学建模、利用强大的计算资源,从海量的信息中挖掘出研究人员所关切的、有研究价值的数据,合理的缩小研究对象范围。因此,本文通过合理的建模并结合网络模型,对合作单位提供的大量胃癌耐药差异表达基因数据进行相关统计分析、筛选、挖掘,以从中找到与胃癌多药耐药相关的有价值数据。首先,本文对胃癌耐药差异表达基因数据进行了处理,主要从数据冗余和标注错误两类问题上对数据中存在的不确定错误或噪声进行了处理以提高数据的可靠性,之后对处理后的数据依据注释内容进行了初次分类,并在初次分类基础上,用聚类算法对各分类数据再进行功能性聚类,从而将每分类数据再分为若干个小规模类;然后,在功能性聚类后数据基础上,通过本文挖掘出的各基因间的相互作用关系建立各分类初级基因调控网络,随后用本文设计的评分机制对各分类初级基因调控网络中的各节点进行打分,并依据分值对节点排序,最后依据排序后的节点选取适当的核心节点,进而以选取的这些核心节点为中心用本文设计的模块挖掘方法进行核心网络模块挖掘,接着,对挖掘出的核心网络模块进行分析。经过相关分析后,本文得出20个核心基因以及它们的附属基因所组成的网络模块是与胃癌多药耐药相关的有价值数据。这种以生物信息学为基础,从网络模型角度出发,基于胃癌耐药的调控网络计算模型研究,为胃癌的多药耐药研究提供了新的思路。同时本文也对促进胃癌耐药机理研究、临床治疗、转录组学研究等科学领域都有着重要的理论与现实意义,对其他癌症耐药研究也具有借鉴作用。