基于基因表达数据的肿瘤预测模型研究

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:tuifei213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
摘 要基因表达数据的分析和研究是生物信息学中重要的研究课题。运用信息科学的方法和技术,基于肿瘤基因表达数据,建立肿瘤的分类预测模型,对肿瘤的发现和识别具有重要意义。本文以多发性骨髓瘤、小圆蓝细胞瘤和结肠癌为研究对象,以基因表达数据为基础,运用人工神经网络建立肿瘤的分类预测模型,取得的主要研究成果如下:第一,本文针对多发性骨髓瘤,应用 BP 网络建立了多发性骨髓瘤 BP 预测模型。该模型使用相关分析法提取了 44 个特征基因,并以此为基础设计了基于三层 BP 网络的预测器。研究结果显示,多发性骨髓瘤 BP 预测模型正确预测了所有测试样本,预测正确率为 100%。本文首次将自组织特征映射网络应用于多发性骨髓瘤的研究,提出了一种具有自组织特征的多发性骨髓瘤自组织预测模型。该模型以自组织特征映射网络为核心,设计了自组织单元,使模型表现出优秀的自组织特征。实验结果表明,多发性骨髓瘤自组织预测模型的预测正确率达到了 100%。第二,关于小圆蓝细胞瘤,本文针对小圆蓝细胞瘤存在的四个亚型,引入了将多类分类问题分解为多个两类分类问题的思想,建立了基于多 BP 网络的小圆蓝细胞瘤多模预测模型。该模型由四个 BP 网络构成,每个 BP 网络分别负责一个亚型的分类。研究结果表明,该模型能正确预测所有测试样本,预测的准确率达到了 100%。第三,针对结肠癌的研究,本文首次应用学习矢量量化算法,建立结肠癌学习矢量量化预测模型。该预测模型提取 50 个特征基因,设计了基于学习矢量量化算法的预测器。结肠癌学习矢量量化预测模型正确划分了 62 个样本中的 57个样本,分类正确率为 91.9%。与 S. Furey 取得的 90.3%的分类正确率,Ben-Dor取得的 88.7%的分类正确率以及 Alon 取得的 87.1%的分类正确率相比,本文创建的结肠癌学习矢量量化预测模型的分类性能最佳。本文研究成果部分发表在《中国生物医学工程学报》(EI 刊源)、《北京工业大学学报》和《第二十二届中国控制会议论文集》中。本课题得到了国家自然科学基金的支持。
其他文献
随着数字图像处理技术和计算机视觉的迅速发展,植物图像识别成为植物分类学跨学科交叉研究的热点。传统的植物识别研究对象主要集中在植物叶片、花朵等局部特征,缺乏植物的整体特征,并且识别背景单一。随着智能手机的普及,常规植物图像爆炸性增长,传统的人工分析提取的特征不够充分且分类器模型复杂度不够,导致植物物种增加到一定数量后识别率不高。因此,研究基于残差网络的深度学习算法,对大量植物图像的分类具有非常重要的
为了提高嗜热芽孢杆菌CHB1产CGTase的工业化潜力,本论文对嗜热芽孢杆菌CHB1来源的CGTase基因进行克隆表达,研究其酶学特性,并从信号肽筛选、发酵条件优化和添加化学通透剂等
血球藻(Haematococcus pluvialis)属于绿藻中的一种,它是单细胞生物。当其处于缺氮、盐胁迫、高光等胁迫条件下时,细胞分裂停止、失去鞭毛并开始积累虾青素。其形态由绿色游
翻译的标准历来是翻译界热衷并众说纷纭的话题,而等值翻译观就是众多翻译标准中影响较为突出的一点。本文从这一标准出发,以两部英国文学经典为语料,指出了英汉翻译中形容词
C-K理论为工程设计提供了一个清晰、明确的解释框架,从而打开了工程设计及问题解决过程的黑箱。从C-K理论视角出发,把系统性创新方法所提供的问题解决流程视为C-K理论中4个算
目的通过分析医疗设备管理中的不足,探讨医疗设备信息化管理的方法和发展趋势。方法从医疗设备引进流程上分析医院器械管理的现状,针对存在的问题阐述了集中有效的管理方法。结
目的:通过酶解将海洋软体动物蛋白转化为功能肽是提高其利用效率的有效途径。但由于海洋软体动物蛋白结构庞大复杂,多以糖蛋白形式存在,水解位点被糖基侧链屏蔽,难以在温和条
水凝胶是由存在亲水作用的大分子长链连结形成三维网络结构并包络水分后形成的“果冻”状的软材料,往往具有贯通多孔结构和一定的粘弹性,出色的保水性且极佳的生物体系适用性
c-Jun氨基末端激酶(JNK)信号途径在细胞增殖、转化、分化和凋亡等发育过程中起着重要作用。核仁关键蛋白1(Nep1)基因是酵母核糖体40S小亚基生物发生所必需,人类Nep1基因的突
函数与方程思想是中学数学的基本思想,主要根据题意,构造恰当的函数,或建立相应的方程来解决问题,是历年高考的重点和热点,纵观历年高考试卷,每年每套高考试题都有出现。