基于多正则约束低秩矩阵分解的基因特征提取

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:wj781228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表达谱现代医学的重要研究内容之一,通过对相关数据的处理和分析,可以快速了解患者的病情,为后续的治疗提供有效参考。与常规数据不同,基因数据有两大特性:一、原始数据一般是高维数据,序列中伴随着大量的噪声和冗余特征;二是可供研究利用的样本数量非常少;这些特性给基因数据的处理和分析带来了巨大的挑战。矩阵的秩是数据信息复杂程度的数学表示,低秩矩阵分解是模式识别中常用的模型,由于其良好的数据恢复能力被广泛用于子空间恢复和分类。针对基因数据分析处理的技术难题,本文借鉴传统的低秩矩阵分解模型和流形学习中的经典理论,做了如下工作:1.基因表达谱研究现状与相关理论分析。介绍了基因表达谱的相关概念、常规处理步骤及相关特征提取方法,详细阐述了低秩矩阵分解和流形学习的相关理论,介绍了一些分类器的分类原理。2.针对基因表达谱数据的高维度、高噪声特点,提出了一种基于多正则约束非负矩阵分解的维数约简模型。借鉴非负矩阵分解模型在数据维数约简方面的独特优势,在该模型基础上引入低秩稀疏约束和流形正则约束。利用非负矩阵分解实现高维数据的低维特征提取,利用流形正则约束保持原始数据的近邻空间结构,同时用低秩稀疏约束去除噪声污染。通过验证提取后特征的分类性能,证明了算法的优越性。3.为了实现小样本状态下对子空间的正确恢复,提出了一种基于非负双图正则隐低秩表示的基因特征提取方法。隐低秩表示通过同时观测数据的主特征和隐含特征,增强了小样本情况下对基因表达谱子空间的数据恢复能力。在双重低秩的基础上,引入双重图正则约束,保持特征提取过程中原始数据的近邻关系结构。借鉴计算机视觉中的低秩稀疏约束,有效去除噪声。非负约束使得计算保持一定的稀疏度,整体表现出更好的鲁棒性。通过与普通低秩表示、隐低秩表示相比,所提出的非负双图正则隐低秩表示算法具有更好的特征提取性能。
其他文献
骆驼体内存在天然缺失轻链的重链抗体(HcAb),其单域抗原结合片段叫作VHH或纳米抗体(nanobody,Nb),是目前已知能够结合抗原的最小实体。纳米抗体独特性质使得VHH在基础研究、诊断
从大规模、多维度的信息数据中提取其蕴含的信息是信息数据技术时代所面临的热点问题。其中,张量分解和重构是针对大规模体数据进行数据分析和信息提取的有效方法。在张量分
随着我国经济的不断发展,配套的社会主义社保制度的不断完善。为适应不同地区不同身份的人民参与社会保障制度,新旧政策频繁交替,地区政策遍地开花,社保政策的碎片化趋势愈演
超材料是一种自然界不存在的、具有奇异物理现象的人工电磁复合材料,利用其结构单元之间的局域电磁耦合效应来调控电磁波的极化状态成为超材料研究领域的一大热点。极化调控
图像超分辨率是一种改善已有的低分辨率图像视觉效果的图像处理技术。旨在从一幅或者多幅低分辨率观测图像中重建出具有较高质量的高分辨率图像。近几年,随着机器学习和模式
通信行业在这些年中得到了高速发展,将来的通信应用会变得越来越复杂,任务数量越来越多,通信系统也将越来越多的使用多核片上系统以提升运算能力。与此同时,随着微电子行业的
本论文合成了两种不同类型的含铁复合材料,并应用于环境净化领域,研究了其对水中无机污染物砷(As(III))和有机污染物甲基橙(MO)的去除性能。(1)先以二聚氰胺为主要原料,经高温焙烧制
噻咯类化合物环外的Si-C键的σ~*轨道和丁二烯部分的π~*轨道有明显的共轭效应,有效地降低了LUMO能级,有利于电子的注入和传输,优良的电子和光学性能使得其在发光材料方面的
疵点分割精度对提高布匹质量评价准确率具有重要的科学意义。本论文以提高疵点分割精度研究为中心,以增强疵点区域对比度为主线,以改进频率调谐显著(FT)方法和多尺度线性(Fra
当前,随着经济全球化和中俄良好伙伴关系的迅猛发展,中俄两国之间的联系也日益紧密,随之而来的是两国间越来越频繁的经济合作。经济作为一个国家发展的必要条件,对整个国家及