基于miRNA表达谱和lncRNA表达谱的癌症分类集成预测方法

来源 :湖南大学 | 被引量 : 0次 | 上传用户:guao_jie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,癌症的死亡率持续上升,已成为对人类生命威胁最大的疾病之一。越来越多的研究表明癌症的发生与miRNA和lncRNA密不可分,在分子层面上,癌症是由于基因表达异常,致使细胞不正常生长,基因的表达参与控制癌症发生的整个过程。尽早发现并治疗癌症,能给患者减轻痛苦,提高治愈率。传统医学进行癌症诊断一般基于形态学,一方面形态学具有很强的主观性,另一方面形态学很难发现早期分子层面的细胞癌变,由此导致大量漏诊和误诊。随着基因芯片技术的飞速发展,快速获取基因表达谱数据成为现实。运用机器学习理论对人类癌细胞和正常细胞的基因表达普数据进行分析,并构建分类模型,可以对癌细胞进行识别,达到预测人体癌症发生的目的。在癌症分类问题研究中,本文提出一种全新的基于miRNA表达谱和lncRNA表达谱的癌症分类集成预测方法。首先将拥有相同样本名的miRNA样本与lncRNA样本进行融合,并十折交叉划分数据集为不同的训练集和测试集;再使用多理论集合特征选择算法进行特征选择,特征初选段引入lncRNA-miRNA关系数据进行特征关联的同时,使用互信息去除无关基因,特征精选阶段提出包含遗传算法和集成模型的包裹法来进一步特征选择,达到去除冗余,搜索最佳特征子集的目的;然后在多个采样空间上训练出单个算法的多个模型,计算每种算法的多个模型在验证集上的分类能力评分作为该算法的后验信息,综合多种算法的后验信息以及对应预测输出进行最终决策;最后让测试集在整体预测模型上进行预测,并依据十折测试的结果来评估模型的分类能力。本文将数据构建层、特征选择层面、预测模型构建层的内容进行信息集成,构成本文的癌症分类集成预测方法。本文对TCGA数据库中典型的三种癌症进行研究,包括乳腺癌、肝癌、胃癌,最终在三种癌症关于miRNA和lncRNA共表达谱数据上的分类准确率均达到98%以上。研究结果显示,在数据融合方面,使用miRNA和lncRNA共表达谱数据相对于使用其中一种数据分类效果有很好的提升;在特征选择方面,引入lncRNAmiRNA关系数据,并结合过滤法和包裹法进行特征选择,最终选出的特征基因能很好的代表全体基因的关键分类信息;在预测模型方面,结合多种算法的多种模型进行预测,很好的融合了不同算法的优点,提高了整体模型泛化能力。
其他文献
动机在二语习得中的重要性毋庸置疑,它不仅是决定学习成败的重要情感因素,也是促进学生学习的重要原动力,如果学生无法树立正确的学习动机,一切将无从谈起。了解学生的动机特
当前田园综合体这一新兴概念正成为响应乡村振兴战略的全新途径与重要发力点,各地已积极开展相关试点工作;另一方面土壤污染问题愈发受到关注,各级政府逐步推进土壤修复工程并取得了一定效果。本文旨在田园综合体导向下,以石门雄黄矿区为例,于修复过程中结合地方特色产业对遭受污染的乡村地区进行适当开发,经规划设计后达到增加当地经济效益、提高居民生活质量、扩大环境治理成果、实现乡村振兴的美好愿景。通过结合群众调查与
词汇是英语学习中至关重要的一部分,对于高中生来说,扩大词汇量是提高英语能力的一个重要途径。近年来,越来越多的学者开始关注词汇附带习得的研究。词汇附带习得是一种隐性
传统单自由度电机仅提供单轴旋转,而典型的运动控制系统例如串联机械手、并联机械手需要具有多个单轴旋转电机,所造成的结构臃肿、控制复杂等缺点限制了其应用和发展。而永磁
真实是纪录片的生命所在,也是纪录片基于其他类型的影片最重要的特性。在没有影视资料之前,人们用文字和图画来纪录当时所发生的事,随着社会文明的进步才有了书籍。古籍是中
保护公民依法获取政府信息的权利是《政府信息公开条例》的立法目的。但由于《政府信息公开条例》中对部分实践操作问题的规定较为笼统,导致在法律适用中一部分申请人利用立
[目的]分析体外应用醋酸棉酚(GAA)对人舌鳞癌Cal-27细胞迁移侵袭影响,探讨醋酸棉酚对人舌鳞癌Cal-27细胞侵袭性作用影响的机制,为临床肿瘤治疗提供相关的理论基础。[方法]1.
无线网络的发展延伸出了许多新方法、新技术,其中通过无线网络及有线网络实现物物互联的物联网(IoT,Internet of Things)发展的尤为迅速。智能家居网络作为物联网中发展最为
水资源的日趋短缺及其造成的经济负荷是制约我国经济快速发展的主要影响因素之一,经济且高效地利用水资源是实现可持续发展的必由途径。我国作为工业生产大国,每年都生产大量的钢坯,即现在的连铸坯,生产过程需要消耗大量的水资源。水足迹作为评价人类生产活动对水资源系统影响的有效工具,对评价连铸坯水足迹的经济影响以及连铸坯水资源管理研究也具有重要的意义。本研究借助水足迹相关理论、生命周期成本分析方法(LCC)和生
[目的]评价内外侧平衡眶减压手术加全身激素治疗、内下壁眶减压手术加全身激素治疗、球旁局部激素注射、全身激素治疗以及球旁激素注射加全身激素治疗用于不同病情TAO的疗效