基于数据融合的疾病基因挖掘算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:FJHGL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于基因表达数据,从海量基因中选择疾病相关基因对理解疾病的发生发展、促进疾病诊断和治疗具有重要意义。目前大多研究工作基于基因表达差异寻找疾病基因,难以发现差异表达较小的疾病相关基因,而通过差异网络获得的功能数据能够较好地体现基因在单个样本中的功能变化水平,发现非差异表达的疾病相关基因。为了充分搜索到疾病相关基因,本文将分别基于平衡及不平衡的基因表达数据,设计融合基因表达数据和功能数据的疾病基因选择方法。该方法既能够挖掘表达差异大的基因,又能够发现表达差异较小但功能发生改变的基因。本文的主要研究工作如下:(1)本文提出了融合基因表达数据和功能数据的疾病基因挖掘算法(GFDGM)。传统基于基因表达数据的差异分析方法难以选择表达差异小但功能上与疾病相关的基因。针对该问题,本文提出一种融合基因表达数据和功能数据的疾病基因挖掘算法。首先,利用样本特异网络方法构建反映基因功能变化的差异网络。其次,基于差异网络量化每个基因在功能变化上的程度,即功能数据,再融合基因表达数据和功能数据。最后,为了使融合数据基因间冗余程度小、关联程度大,基于互信息设计了一种非支配排序基因选择方法挖掘疾病相关基因。实验结果表明,基于融合数据的基因选择算法挖掘的基因子集相比原始数据在疾病诊断方面有较为明显的提升,且基因子集中包含表达差异小的疾病相关基因。(2)本文提出了融合不平衡数据的疾病基因挖掘算法(IFDGS)。基于(1)的数据融合方法在不平衡数据融合过程中,对于少数类样本的功能信息获取不足,导致在样本不平衡情况下基因选择算法更加难以充分搜索疾病相关基因。为此,本文提出融合不平衡基因表达数据和功能数据的疾病基因挖掘算法。首先,算法利用过采样方法SMOTE对少数类样本过采样,将不平衡数据转化为平衡数据。其次,在平衡数据基础上使用(1)的数据融合方法融合数据。最后,算法以分类错误率和特征数作为目标函数,结合多目标进化优化的基因选择算法搜索疾病基因。为了保证种群的多样性和所选基因与疾病相关性,IFDGS算法设计了初始化策略和种群更新策略。通过在四个不平衡数据集和四个经典的基于不平衡数据的特征选择算法进行对比。实验结果表明,IFDGS相较于对比算法在诊断方面更有一定的竞争优势。
其他文献
随着社会的发展,机动车辆的数量不断增加,这给交通管理带来了巨大的挑战。车牌是识别车辆最重要的媒介。因此,车牌识别系统作为图像处理、计算机视觉和深度学习技术在智能交
图流是一种大规模的、高度动态的、无止境的图结构,其节点和边以流的形式快速到达,图流的这些性质使得它很难被存储在内存里面,甚至磁盘上。很多应用可以用图流来描述,例如社交网络、电商网络等。在这些应用中,链路预测是一个很重要的问题,其目的是预测网络中尚未产生连边的两个节点之间产生链接的可能性。然而,在图流中,针对节点的链路预测相比于常规意义上的链路预测有着更广泛的应用。考虑好友推荐的例子,好友推荐系统一
工艺尺寸的缩减及供电电压的下降,使得节点电容及节点存储的电荷都变小。因此,较小的错误电荷就能使节点的逻辑状态发生变化。由于电荷共享机制,单粒子撞击也可以导致多节点
5G作为新基建的龙头,采用Massive MIMO(大规模多进多出)天线进行网络覆盖,以满足高速率大容量的信息传递。然而,Massive MIMO天线典型具有64 TR通道,采用数字波束形成实现广
随着惯性器件、微型传感器等精密微小型系统在航空航天、兵器和医疗等行业的广泛应用,微小型系统的结构与功能愈来愈复杂,对微小型系统的精度要求也越来越高。因此面向微小型结构件的高精度对位装配是目前国内外研究的热点与难点。微装配过程涉及到微夹持技术、精密对位检测技术、微力反馈技术、计算机图形学以及自动控制技术等多种理论,研究的难度大、过程复杂。在微装配领域,国内外的研究虽然已取得了很大的成果,但仍然缺乏成
废弃电器电子产品(WEEE)的回收处理问题日益引起人们的关注。目前,我国的WEEE废弃量大,回收量却不多,拆解处理后的再生利用率也相对较低。面对这一现状,回收处理企业通过创新研发提高WEEE再生利用率成为一项重要的战略选择。为了研究回收处理商的创新研发决策以及政府奖惩机制的影响,本文在双寡头竞争市场的背景下,考虑了技术溢出效应,构建了无奖惩机制下回收处理企业均不创新研发、仅有一个回收处理企业创新研
近些年,在我国职业教育蓬勃发展的背景下,在校学生人数的增长呈几何倍数,大量学生的进入,给高职院校一直以来沿用的传统学生管理方式带来了很多问题,核心问题就是目前高职院
随着汽车工业对节能减排和安全性能要求的日益提高,高强钢的热冲压技术被广泛的应用到汽车的结构件和安全件制造。传统热冲压工艺得到的完全马氏体零件,强度高但延伸率低,不能满足碰撞中吸收能量的安全性要求。因此,为了解决零件力学性能与车身安全性能要求相匹配的问题发展出了与车身安全性要求相适应的高强钢的热冲压TTP(Tailored Tempering Properties)工艺,即在零件的局部区域力学性能不
随着计算机技术的不断提高和医疗技术的新需求,学者们不满足于当前的病因诊断方法:医护人员通常根据自己的医学知识对抽象的2D医学切片图像进行病因判断。这种方法仅依赖于医
随着互联网技术的进步,大数据时代的来临,受教育者自主学习的能力也在不断提升。传统以灌输为主的思想政治教育方式呈现出了种种弊端,难以适应当前时代对思想政治教育提出的