基于贝叶斯网络的肿瘤基因表达谱分析

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:hero18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片,又称DNA芯片或DNA微阵列,它们是DNA杂交探针技术与半导体工业技术相结合的结晶,并伴随着“人类基因组计划”而发展起来的一门新兴技术,具有高通量、大规模、平行性等特点,因而被广泛地应用于肿瘤发生发展过程中基因表达分析。由于基因表达谱具有小-样本、高维度的特点,给数据挖掘提出了新课题。如何选择合适的方法进行精确的肿瘤亚型分类,提取尽量少的具有分类信息的特征基因,认识肿瘤产生和发展机制并最终达到临床治疗的目的,是当前面临的关键性问题。而贝叶斯网是将概率、统计应用于复杂系统的不确定性推理和数据分析的一种有效工具,它起源于20世纪80年代中期对人工智能中的不确定性问题的研究,用贝叶斯网络构建分类模型具有直观的语义,能对生物学意义分析提供指导。现有方法大多使用单个数据集进行分析,样本量少,提取的特征基因应用于其他同类数据分类效果差。基于此,本文将研究重点放在利用贝叶斯网络构建分类器模型上,并研究同时使用多个同类数据的方法。主要做了如下工作:  1.提出了一种遗传算法与支持向量机集合的特征基因提取方法。方法改变了以往只从单一数据集提取特征基因的做法,并行分析3个胃癌微阵列数据集,提取的特征基因在所有数据集中均达到了90%以上的分类准确率。共进行了4580次实验,统计基因在遗传算法种群中出现的次数,依次排序,得出了可能对胃癌亚型分类起关键作用的基因(AGT,FBLN1)。对提取的特征基因的生物学意义分析结果表明,该方法能够很好得识别肿瘤分类基因,所选择的特征基因对人类胃癌的诊断和分型有重要意义。  2.使用遗传算法和贝叶斯信息准则(BIC)学习贝叶斯网络结构,算法不要求节点以拓扑序排列,可以有效地进行全局搜索。根据贝叶斯网络结构是有向无环图(DAG)的特点,提出一种新的遗传算法交叉和变异操作,并提出使用最大跨度权重树构建遗传算法初始种群,使得算法收敛速度加快,更容易收敛于全局最优解。实验结果表明本文算法能有效地从数据中学习贝叶斯网络结构。  3.使用遗传算法和贝叶斯网络模型构建分类器,构建过程中同时使用三个基因表达谱进行学习,分类网络具有直观的语义。首先使用分类准确率作为优化目标,发现在算法优化过程中,网络向朴素贝叶斯网络结果演化,通过将BIC与分类准确率同时作为优化目标克服了这个问题。通过留一法计算模型分类准确率,分类准确率达到了99.8%。最后使用GO和pathway对网络结构进行了分析,网络中除类别节点外的16条边,有11条边连接的两个基因同时存在于一条基因通路或GO中,与现有生物医学知识有较大程度的重合。
其他文献
软件复用作为一种提高软件生产率和质量的有效途径,被认为继面向对象方法之后的一个新的技术热潮。基于构件的软件开发(Component Based SoftwareDevelopment,CBSD)是实现软
随着光学、电子学以及计算机技术的不断发展,双目立体视觉技术因其获取信息量丰富、具有非接触式采集等特点,不仅成为工业检测、生物医学、虚拟瑚实等领域的关键技术,还成功地应
移动机器人技术在近几十年来得到了迅速的发展,被广泛应用到生产、生活的各个领域中,极大地促进了社会生产力的发展和人类生活水平的提高。移动机器人机械臂视觉控制系统是一个
在当今高度信息化的社会中,人们通过电视、网络、报纸、杂志等来获取大量的信息。统计图是人们在日常生活中常见的信息载体。由于其具有直观、通俗易懂、包含信息量大等特点被
本文针对电话信道多语言环境下的语音识别和语音搜索的技术难题,进行了广泛而深入的研究,主要内容包括:   首先,在跨语种通用声学建模方面,本文对基于子空间高斯混合模型
信息提取是人类其他高级认知活动的基础,探索不同层级类概念的加工机制,可以为人类高级认知功能的研究提供参考和借鉴。根据类概念的抽象程度,类概念可以分为三个层级:上位水平、
射频识别(Radio Frequency Identification,RFID)技术具有高速移动物体识别、多目标识别和非接触识别等特点,得到了全世界众多领域的广泛关注和青睐。普通的RFID标签主要由硅
随着互联网的快速普及和数字影像采集处理技术的发展,网络视频行业迅速崛起,并在人们的日常生活中起着越来越重要的作用。作为一种包含图像、声音、文字等多信息的综合性媒体
该文在分析图象处理、特征提取和神经网络理论的基础上,设计并实现了一种基于BP神经网络的指纹自动识别系统.对于自动处理指纹的摄入、识别等技术进行了深入的讨论,并通过实
利用光谱仪对农作物进行长势监测已经成为世界农业的发展方向。随着光学,电子技术的发展,光谱仪朝着微型化,低噪声,高分辨率,宽光谱范围等方向发展;另外,光谱仪与PC机之间的数据传输