一种基于基因本体的无监督聚类方法

来源 :福建农林大学 | 被引量 : 0次 | 上传用户:wqkabc0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着DNA微阵列技术的发展,获得海量基因表达数据已成为可能,如何从这些数据中挖掘有用信息已成为亟待解决的问题。聚类分析是基因表达分析中应用最广泛且有效的方法之一。对基因进行聚类分析可以将具有相似表达模式的基因归纳成簇,同一簇内的基因在功能上可能相似或关联,因此我们可以根据同一簇中已知基因的功能推测未知基因的功能。本研究应用层次聚类、K-均值、自组织映射网格、模糊C均值方法进行了基因表达聚类分析,同时对模糊C均值方法引入基因本体进行改进,利用生物过程本体合理地确定了聚类数目,克服了聚类数目预先不可知的缺陷。其次,传统模糊C均值对初始聚类中心十分敏感,本文利用基因注释证据编码的可信度确定了初始隶属度矩阵。不同算法的聚类质量用Z值相互比较。另外,为了更好地比较基于本体的模糊C均值与传统模糊C均值的结果,本文还应用了三种有效性评价函数对基于本体的模糊C均值的聚类结果进行有效性评价,从数据集的几何结构特征上衡量类内的紧凑度和类间的分离度,并设置不同有效性评价方法下的最佳初始化参数值。实验发现,Amine M.Bensaid有效性函数最适合做本数据集的评价指标。通过比较模糊C均值和基于本体的模糊C均值结果的有效值,发现基因本体的应用有助于取得具有更好的类内紧凑度和类间分离度聚类结果。最后比较不同算法的聚类结果的质量,证明了基因本体可以大大地提高聚类的质量。
其他文献
  拟建项目位于杭州市滨江区,建筑高度280m,采用后注浆钻孔灌注桩作为工程桩。大面积成桩前,进行了两批次的单桩静载荷试验,第一次试桩桩端入土深度58m~68m,第二次减小到50m
抗菌肽是一类带正电荷的两亲性小分子肽的总称,具有抗菌谱广、不易产生耐药性等优点。抗菌肽来源广泛,分类多样,且生物活性很强,在医药、畜牧业以及食品等领域应用广泛。  杂合
苯并[c]啡啶类生物碱是一类异喹啉类生物碱,具有广谱生物活性,主要包括抗癌、杀菌、消炎、杀虫等。本文第一部分综述了这类生物碱的生物活性、生物来源、以及合成的最新研究情
  支撑轴力伺服系统可以智能调整钢支撑的轴力,并对地下维护结构的变形进行实时监测,使地下基坑工程的施工处于可控状态,确保施工场地自身及周边建筑物的安全。该系统有一套完
大蒜富含17种氨基酸,35种含硫有机物及各种微量元素,具有抗菌消炎、抗氧化、调节血糖及保护肝脏等医疗保健功能。黑蒜为新鲜大蒜的一种发酵熟化制品,去除了新鲜大蒜的蒜臭味,酸甜
本论文针对新疆克拉玛依重质原油进行注空气低温氧化热解模拟实验,采用高压氧化管,研究不同温度压力下重质原油的低温氧化过程。进一步了解原油低温氧化过程。另外本论文针对
论述一种新型的十字形抗拔桩,与方形钢筋混凝土抗拔桩相比,在相同抗拔荷载情况下,可节省近30%~44%的混凝土方量,对受力机理、抗挤压、实际设计与施工等方面作了一定的分析与比较
  BIM 技术是建设部建筑业信息化发展纲要中所论述的重要内容,BIM 技术在基坑工程中体现了精确的立体三维性.阐述了岩土工程基坑工程中应用BIM 技术的内容、方法、要点及发
本文针对大型超深基坑中的人工挖孔桩、复杂地层冲击成孔灌注桩、承压水砂卵石地层高压旋喷桩、大尺寸大重量钢筋笼的制作运输安装、超长锚索的施工中遇到的问题,详细地论述
疫病是辣椒重要病害之一,当前还没有有效的防治手段,培育和推广应用抗病品种是解决辣椒病害的最为根本有效的技术对策,而现代基因工程为培育抗病品种提供了有力的手段并已经显示出广阔的应用前景,开发在抗病基因工程中有应用价值的基因并阐明其作用机制是当前十分重要的研究课题。elicitins是存在于Phytophthora和Pythium两个属的植物病原卵菌的能激活植物防御反应的激发子,在茄科植物抗病基因工程