五种双聚类算法在基因表达谱数据中的比较与评价

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:jianrui02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来生物高通量技术的发展,基因微阵列数据呈指数增长趋势,如何有效地从这些海量的数据中提取有价值的信息显得尤为重要。在微阵列数据解析时,传统的聚类分析是一个很重要的工具,但它们存在着一定的不足:1)传统的聚类方法只适合实验条件比较少的数据集,因为这些算法是在所有的实验条件下进行基因的聚类;2)传统的聚类方法生成的类之间没有重叠,一个基因最多只能出现在一个聚类结果中,因此难以识别那些参与多个功能的基因。针对这些问题,很多研究者提出了一个改进的聚类思想:双聚类算法。目前已有很多识别bicluster的双聚类算法不断地被研究和应用。Bicluster中的基因在某些实验条件下有着相似的表达模式,甚至是参与相似的功能过程。然而,不同的双聚类算法会生成不同的bicluster,进而会产生不同生物学意义的分析结果。因此,对于这些双聚类算法的比较和检验显得尤为重要。在此研究中,我们选择了五种不同的双聚类算法(BIMAX,FABIA,ISA,QUBIC和SAMBA)和两组维数不同的拟南芥表达数据集(GDS1620和pathway),来比较这些算法的生物学表现。GO(Gene Ontology)注释和PPI(Protein-Protein Interaction)网络被用来检验这些算法生成的bicluster的生物学意义。为了客观、量化地比较各bicluster的意义和不同算法的表现,我们在研究中提出了两种打分方法:加权富集(WE)得分和蛋白质-蛋白质互作(PPI)得分。对于每一种打分方法,通过把所有的bicluster按照得分大小综合到一个统一的排序中,我们可以很直观地分析出这些双聚类算法的表现。WE和PPI这两种打分方法在验证bicluster的生物学意义时都被证明是有效的。两种方法得到的得分之间已被检验到有着显著的正相关,这也印证了这两种方法的一致性。对于这五种双聚类算法的检验和比较显示:(1)对于数据集GDS1620,ISA是五种算法中最有效的一个;对于数据集pathway,BIMAX的表现要优于其他四种算法;(2)ISA和BIMAX这两种算法都具有数据依赖性,前者不太适合基因数小的数据集,后者更适用于实验条件更多的数据集;(3)FAIBA和QUBIC在本研究中表现的都不理想,或许它们更适合具有大量基因和大量实验条件的数据集;(4)SAMBA算法没有明显的数据依赖性,因为它在两个给定的数据集中表现的都不错。这些结果信息能够指导研究者们根据自己的数据集选择合理的算法。
其他文献
通过分析大学生校园贷款的法律性质认为,大学生与小额贷款公司形成了民法上的借贷合同,适用我国《合同法》的相关规定。鉴于大学生校园贷款多为信用贷款,违约风险和追贷成本
以赤峰市敖汉旗水平梯田土壤为研究对象,选取玉米、谷子、高粱、绿豆4种当地多年主栽作物的表层(0~20 cm)土壤216个样品,通过方差分析方法探究梯田4种作物表层土壤有机碳含量
目前高速公路各部位存在着不同程度的功能不足与功能过剩,各部位的成本分配不尽合理。文中提出了高速公路设计中可改进的内容和方法。
第10-11族元素形成的重金属配合物和团簇因其在工业合成和工业催化中的广泛应用而备受瞩目,其中金和钯体系具有卓越的光学、电学和催化性质,在双氧水的合成、一氧化碳氧化、
气辉是中高层大气中产生的重要光化学现象之一。气辉辐射携带重要的光化和动力学信息,可以作为研究中高层大气特征的重要示踪剂。本文主要基于地基气辉光学观测仪,开展了以下
我国是农业大国,在科技发展、互联网逐渐普及的21世纪,农业经济发展也逐渐受到互联网的影响。基于此,本文针对农业产品销售现状进行了分析,通过提高农民对电子商务的了解、完
植物形态的仿真一直是计算机图形学的热点。对植物的整体结构的建模一般采用L系统,将植物抽象成模块的组合,将植物的生长过程表现为子模块代替父模块的过程。基于L系统和均匀
对于盲人行走避障而言,准确、实时的障碍物检测和信息提示是其研究的核心。在盲人行走过程中识别出其周围环境信息并作出相应的指示,目的是让其避免碰撞到障碍物以防止受伤。障碍物检测的方法有很多,比如使用超声波、红外以及其他类型的传感器等。但是,由于超声波检测只能获取距离信息,因此它不能全面反映盲人周围环境信息。此外,由于障碍物种类和形状的多样性,数据采集设备和障碍物检测算法都会受到环境的影响。全球定位系统
选取位于西藏拉萨的罗布林卡、龙王潭公园、布达拉宫广场,位于林芝的福建公园,以及位于昌都的天津广场等5个城市公园,于2017年5—6月采取样线法对其中的鸟类群落组成和外来鸟
哺乳动物出生前后形成的原始卵泡库是雌性动物一生中发育卵泡与成熟卵母细胞的唯一来源,其大小代表了雌性哺乳动物一生的生育能力。原始卵泡形成异常会导致合胞体破裂受阻、