基因微阵列数据的双向聚类算法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:hanyanwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片是由大量DNA或寡核苷酸探针密集排列所形成的探针阵列。基因芯片上探针与经荧光标记的目标样品进行生物反应,利用专用芯片检测系统并借助于一定的软件即可得到基因表达数据。这个技术应用于不同发展阶段,不同人体组织,不同临床条件以及不同生物体等条件下的基因表达水平的测量。基因芯片的出现正在给生命科学研究、疾病诊断、新药开发、食品卫生监督等领域带来一场革命。本文的贡献主要体现在以下几个方面:首先,对基因数据分析中的一种双向聚类方法—格子模型法进行了深入的分析,并对其进行了改进。格子模型是一个混合有二进制变量和连续变量的模型。对于该模型,传统的用于连续变量的优化算法不再适用。为此,本文提出了一种新颖的神经网络方法来解决这种混合有二进制变量和连续变量的优化问题,并将该方法应用于酵母数据分析,实验结果表明使用这种方法后双聚类的精度得到了很大的提高。其次,本文还对基因数据分析的另一种方法非负矩阵分解方法进行了改进。传统的非负矩阵分解算法有一定缺陷,其初始值是随机设定的,因此在迭代过程中会出现微小的抖动。为此本文在迭代计算过程中加入了数据平滑处理,并将该方法用于一组白血病微阵列数据分析。实验结果表明,改进过的非负矩阵分解算法提高了分类的准确率,同时这个方法避免了NMF算法的“零值”问题。第三,本文介绍了NNMF算法的基本原理,对其加入了一个平滑处理,增加了数据元素之间的联系,同时这个方法由于抬高了数据,避免了NMF算法中的“零值”问题。本文首次将NNMF算法应用于生物信息学中,用白血病微阵列数据进行了实验。实验结果表明,该方法提高了分类的准确率及算法的收敛速度。
其他文献
阐述了医药仓库的除湿现状,并对存在的问题进行分析,提出带热回收冷冻除湿系统的解决方案,并与传统的冷冻除湿机性能以及节能效果进行对比。
价值命题不同于事实命题,没有符合论意义上的真假。但是价值命题也有正确与错误的区别,正确的价值命题是有充足理由的合理命题,而错误的价值命题是缺乏理由的不合理命题。价
生活与工作的界限被打破,下班后上班族依然无奈地在微信工作群里"刷"工作中秋假期刚过,不少上班族都度过了一个愉快、团圆的佳节。然而,记者调查发现,不少上班族在和家人团聚、
盲均衡技术是一种新兴的均衡技术,它不借助训练序列,仅仅利用接收序列本身的先验信息来进行自适应均衡。盲均衡技术的研究已成为近年来数字通信领域最活跃的分支之一。与传统均
雷达信号处理通用芯片是一个内嵌DSP核的,专用于雷达基带信号处理的SOC芯片。由于芯片的功能代码已经初步实现,当前迫切需要的是一个能够验证该代码的硬件系统。为了保证处于设
类石墨氮化碳(g-C3N4)具有原材料成本低和电子能带结构独特等优点,且有可见光活性。以g-C3N4为催化剂的光催化技术在解决环境污染和能源短缺等问题方面具有广阔的应用前景。但g
为培育发展社区社会组织,充分发挥社区社会组织在城乡社区建设和社会治理中的积极作用,青海省民政厅正式出台《青海省关于大力培育发展社区社会组织的实施意见》(以下简称《
层次化方法在当前VLSI布图中被广泛采用,以应对集成电路规模的不断扩大。随着超大规模集成电路工艺的不断发展,热问题在集成电路设计中中凸显出来。本文对大规模集成电路物理
在毫米波系统中,毫米波信号源输出功率一直是技术发展的一个瓶颈。本论文在对国内外毫米波功率放大器分析的基础上,仿真设计了输出功率高达5W的毫米波(28GHz~30GHz)高功率放大器
硅和氮化镓是第一代和第三代半导体材料的典型代表。GaN具有优良的光电性质和优异的机械性能,被认为是制备短波长光电子器件的最佳材料之一。因为GaN缺少合适的衬底,所以硅基