基于聚类技术的微阵列数据分析与处理

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:zhusimeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学的快速发展对数据挖掘技术提出了新的挑战。本文详细介绍了数据挖掘技术中的聚类技术,分析了其特点,并对聚类结果的评价方法进行了讨论以及这些方法在微阵列数据分析中的应用。针对模糊聚类算法,提出了动态模糊聚类算法,通过计算样本之间的模糊相似矩阵,求得模糊等价矩阵R,不失真的反映它们之间的内在关联.将模糊等价矩阵R中的元素降序排列,其集合记为λ={λ1,λ2,…,λk},按照不同的λ的取值进行聚类,利用DVIndex和Intra-Inter-ValidityIndex来计算评价每个聚类的有效值。根据每个不同聚类的有效值,可以判断出最优的聚类数目,得到较好的聚类结果。该方法克服了其它模糊聚类方法不能够判断最优聚类数目的问题,试验证明此方法对聚类数目具有很好的估计。先后用人工数据和Iris数据进行检验,针对经典白血病(Leukaemia)及Colon微阵列数据集进行聚类,取得的了很好的效果,与k-means方法进行对比研究,发现该方法优于k-means方法。最后将这个模糊聚类分析的代码实现到R统计软件包中,创建了“fuzzycluster”程序包。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
在数理统计中,影响分析理论作为判断模型扰动对统计推断结果的有效理论工具,已在许多线性模型中有着重要的作用.但现有的理论中对时间序列单位根检验却没有太多的关注.因此本文对
本文对极值图论中的两个问题作了研究,所获得的几个主要结果如下。 (1) 设br(K)是最小的整数n,使得对K用k种颜色进行任意着色都会包含一个单色的K。令z(n;t) 表示K 的子图在
本文由三章组成。在第一章,我们介绍了研究工作的目的及其背景。在后两章,我们分别讨论了两个不同的问题,并给出了相应的结果。在第二章中,我们考虑下面的半线性热方程: 一方面
生物信息中,一个很重要的研究领域是如何从大量microarray实验的数据中挖掘出有生物学意义的知识,而其中如何寻找在两类或两类以上样本中表达差异的基因集合(或基因pathway)正
本论文研究了仅含对流扩散方程末状态部分信息的反问题。分别考虑了其逆时问题和构成4DVAR数据同化算法基础的源项反问题。研究了对流扩散方程逆时问题的不适定性。构建了对
在中学数学现行教材中,函数是一大模块,占有比较重要的位置,是高考的考点和热点,也是师生教学上的难点。如何提高函数这部分内容的教学质量和教学效果,让学生轻松而全面地掌
在实际应用中,会遇到大量的微分方程,包括非线性微分方程、线性微分方程、常系数微分方程、变系数微分方程。他们之中只有极少部分能解出精确解,绝大多数微分方程难以解出精确解
证券投资组合如何构建,优化和套期保值,本文提供了一个可行的操作过程。首先,引入个股风险价格,采用聚类分析的方法选择股票。其次,确定由这些股票组成投资组合的所承担风险范围,选
求解特征值是力学和理论物理中经常要遇到的问题。而在这些问题中对偏微分方程离散得到的矩阵通常都有对称正定的性质。但在遇到一些大型病态矩阵时,通常的方法常常显得捉襟见