基于图信号处理的基因表达数据降维方法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:zhao330300096
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会的发展,癌症的病发率越来越高。如何在癌症早期对癌症做出快速有效的诊断,提高患者的生存率成为一个极待解决的社会问题。高通量基因测序、DNA微阵列等技术的快速发展使得基因表达数据可以被大量获取,利用基因表达数据对癌症进行分析诊断成为了一种新兴的诊疗手段。然而,一个基因芯片上往往具有成千上万的基因,同时由于基因检测的价格昂贵且检测时基因数据易受噪声影响,可获得的有效病例样本相对较少,造成了基因表达数据具有高维度、小样本的特点,导致了无法避免的维度诅咒问题。此外,由于发生癌变的基因往往只有很少的部分,样本中大部分是与癌症无关的冗余基因。基因表达数据的这些特点使得直接利用其对癌症进行分类识别效率低且分类精度不理想,因此,如何从海量的基因表达数据中筛选出与癌症分类识别相关的基因是基因表达数据分析和处理的一个关键问题。针对传统的基因特征选择方法复杂度高,分类效果较差等问题,本文提出了两种降维算法对基因表达数据进行降维,以提取与癌症相关的基因,筛选出分类能力强的基因,并在多个真实基因数据集上进行仿真实验,验证了本文算法的有效性。本文的主要工作如下:(1)针对现有基因特征选择算法较少考虑样本(病人/正常人)之间及基因之间的相关性,不能有效去除冗余等问题,提出了一种基于图模型和图上平滑性的基因选择算法。通过将样本(病人/正常人)建模为图的顶点,将基因数据建模为图信号,构建了几种基因选择图;利用图拉普拉斯矩阵,选择非光滑度指标最高且可分布计算的图信号,确定出数量较少的分类能力强的基因,有利于快速实现基因表达数据的降维。最后,在真实数据集上的数值实验表明,提出的方法比现有方法具有更强的性能。(2)为了进一步捕获基因数据之间的相关性,提出了一种基于C3NET和图滤波器的基因特征选择算法。首先,为了获得基因之间的调控关系,利用C3NET(Conservative causal core)推断出基因表达数据的基因调控网络;然后,将基因表达数据中的基因建模为图上节点,每个基因的基因数据构建为图信号,将得到的基因调控网络建模为邻接矩阵,计算其图拉普拉斯矩阵和图傅里叶变换,并且提出了一种基于图傅里叶变换的基因分类能力的评估方法,计算每个基因的分类能力;最后,设计了高通图滤波器对基因数据进行滤波,筛选出滤波后分类能力高的基因。仿真实验表明,与现有的基因选择算法相比,本文算法筛选出的基因分类能力更高,在不同的分类器中均能保持较高的分类准确率。
其他文献
通信网络的大时代背景下,数字图像已成为人们获取信息的重要来源,军事、医疗等领域的图像属于机密和隐私,若在传播过程中被攻击者截获可能会造成无法估计的严重后果,因此,保证“敏感”图像的信息安全性是一项重要且迫切的工作。考虑到混沌与密码学的适配性,针对数字图像在网络传播中的安全性和可靠性问题,本论文构造了两种性能优良的混沌系统,并在此基础上提出了两种图像加密算法。具体的创新点及工作如下:(1)针对一维混
学位
背景:创伤后应激障碍(Post-traumatic Stress Disorder,PTSD)是一种继发于严重创伤应激事件后延迟出现并长期存在的精神心理疾病,其诊断标准包括侵入性创伤记忆,回避创伤相关刺激,警觉性增高及认知和心境方面负性改变等,已成为一种常见的神经精神问题并导致个人健康和社会成本的严重破坏。尽管对PTSD的研究取得了巨大的进展,但其发病机制、治疗靶标仍不完全清楚。目前,仅有舍曲林和
学位
无人机集群因具有感知范围广、部署灵活等优点,被广泛应用于电子侦察。多功能雷达(Multi-Function Radar,MFR)工作模式识别作为电子侦察的核心内容,对截获的信号样本进行分析以判定MFR的工作模式,为制定电子对抗策略提供情报基础。本文以无人机集群对抗多个MFR为研究背景,引入图信号处理技术,建立信号样本间的融合依据,围绕工作模式样本不平衡且训练样本较少情况下的MFR工作模式识别开展了
学位
目的:总结导师诊治月经病的学术经验,通过痛经发病因素调查加强对基层部队女青年痛经发病情况及中医药服务需求的认识,为应用导师学术经验做好基层部队女青年中医药服务和健康指导提供依据。方法:1.学术思想总结方法:以导师的门诊病案、诊间讲解、理论授课、专题讲座、论文著作、疑难病例答疑等为基础资料,参考中医经典古籍和近现代名家论述,追溯导师学术思想的理论依据,分析归纳导师诊治月经病的临床经验,重点总结导师对
学位
<正>膀胱癌为泌尿系统常见的一种恶性肿瘤,对于肌层浸润性膀胱癌患者而言,通过采取膀胱全切除术进行治疗可有效延长患者生存时间。但术后患者需行输尿管或回肠膀胱皮肤造口,可对其生理、心理造成影响,并会显著损害其日后的生活质量[1]。患者出院准备度是指医护人员在患者出院前对其生理、心理及社会等方面的状况进行综合评估,判断患者是否具备离开医院、重返社会及进行疾病管理的能力[2]。此指标对于促进疾病康复具有积
期刊
研究背景骨质疏松(Osteoporosis,OP)是一种常见全身代谢性骨病,以骨量减少、骨微结构破坏、脆性增高、力学强度下降为特征,易增加骨折风险。随着人口老龄化进展,骨质疏松发病率正逐步升高,并已成为我国面临的重要公共健康问题。骨稳态的过程涉及成骨细胞介导的新骨形成与破骨细胞介导的旧骨吸收之间的动态平衡,并受到机体多个器官、系统的复杂调控。当调控异常时,骨代谢平衡被打破,骨形成小于骨吸收,即可表
学位
第一部分肌筋膜自治互治法对训练性膝痛的临床疗效目的:观察肌筋膜自治互治法对训练性膝痛的临床疗效。方法:将90例训练性膝痛受试者随机分为肌筋膜自治互治组和膏药组,每组各45例,分别采用肌筋膜自治互治法和膏药贴敷治疗。各组均治疗2周。观察指标:数字评定量表评分、Lysholm评分、EQ-5D-5L健康效用值。观察时间节点:治疗前、首次治疗后即刻、治疗1周后、治疗2周后、疗程(2周)结束后的第2周。分析
学位
行人重识别(Person Re-identification,Re ID),指根据行人特征在相同或不同视角摄像头下检索同一行人。具体来说就是给定一个监控摄像头下的行人图像,检索跨设备下该行人的图像。行人重识别在智能安防、智能寻人系统、智能商业和相册聚类、家庭机器人等领域具有很高的应用价值。在基于卷积神经网络(Convolutional Neural Network,CNN)的深度学习行人重识别的切
学位
随着全球卫星导航系统(Global Navigation Satellite System,GNSS)的广泛应用和智慧城市的快速发展,在城市环境下的定位需求愈发明显,对定位可靠性的需求也进一步提升。当前,在许多城市定位场景中,用户所面临的主要问题,已不再是无法获得足够数量的可视卫星,而是如何正确检测并排除那些受非视距与多径干扰等误差影响严重的卫星信号,以确保获得一个可靠的定位结果。本文以城市复杂环
学位
研究目的基于影像资料,通过形态学特征分析,探究胸主动脉腔内修复术(TEVAR)后腹主动脉段残余裂口(ARITs)对中远期腹段假腔重塑的影响;基于计算流体力学(CFD)仿真技术,评估TEVAR术后早期血液动力学参数预测血管重塑趋势的有效性,探索影响腹段假腔重塑的重要参数,模拟封闭肾下ARITs并分析其对腹段真、假腔重塑的影响。研究方法1、形态学特征分析部分,回顾性分析2009年11月至2019年11
学位