基于流形学习的癌症基因表达数据聚类分析

被引量 : 0次 | 上传用户:long12312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症基因表达数据具有高维、小样本的特点,要想从如此复杂的基因表达数据中挖掘出有用的信息,就要对数据进行分析处理。目前已经有很多降维聚类的方法应用到癌症基因表达数据中,从中发现了有用的信息并应用到疾病的治疗和早期诊断中。本文针对癌症基因表达数据的特点,提出一种基于流形学习的聚类分析方法。该方法把流形学习和聚类分析结合到一起,实现了癌症基因表达数据的降维可视化,并得到了很好的聚类结果。首先,本文介绍了有关流形学习和基因聚类的基本理论,分析了几种代表性的流形学习算法,阐述了这几种算法的基本原理和步骤,以及每种算法的优缺点。接着介绍了聚类算法在基因表达数据分析中的应用,并列举出几种常用的基因表达数据聚类算法。其次,本文提出了一种改进距离的多组权局部线性嵌入算法。该算法针对癌症基因表达数据分布不均匀的特点,采用一种新的距离来代替LLE算法中的欧氏距离求解近邻点,并且利用了多组线性无关的权值来构造线性结构,能得到更好的嵌入结果。再次,本文提出了一种基于流形学习的癌症基因表达数据聚类分析方法。通过分析癌症基因表达数据的流形分布特点,把流形学习和聚类的方法相结合,估计数据的本征维数实现可视化,然后按照数据的低维结构进行聚类分析。最后,本文将基于流形学习的癌症基因表达数据聚类分析方法应用到两个癌症数据集中。用matlab进行实验仿真,并对实验的结果进行了分析和评价。
其他文献
车道线智能识别是智能安全驾驶领域非常重要与基本的技术组成部分基于机器视觉的车道线智能识别技术通过车载摄像机捕捉道路图像,利用算法对图像中的车道线进行智能识别,提醒驾
作为美国现实主义政治思想之父、美国现代最具有创造性的基督教神学家,莱茵霍尔德·尼布尔坚持原罪论,强调人的不完美,并且指出集体不道德不可避免,单纯依靠道德与理想是不足以解
随着虚拟技术、云计算、物联网、云制造等新型技术以及高速切削和精密加工技术的迅速发展,先进制造技术对数控系统提出更高要求。为了满足先进制造技术的需求,本文综合运用多种
目的研究Twist、E-cadherin和N-cadherin在正常子宫内膜和子宫内膜样腺癌组织中的表达,分析、探讨Twist、E-cadherin和N-cadherin蛋白在子宫内膜样腺癌中表达的意义及其与各临
近年来,我国物流业有了一定的发展,物流业被国务院列为十大振兴产业之一,方兴未艾。但目前,国内很少对煤炭物流业做深入研究,大多数人简单地认为煤炭运输就是散堆装货物运输,不再需
我国三网融合的正式启动,广电网、电信网、互联网三网合而为一,也标志着我国广电产业全新时代的来临。在未来的广电产业中,任何一家广电集团,都不可能在产业价值链的所有环节都具
随着河南经济的飞快发展,公路运输所服务的对象也有了明显的变化,主要体现在大型车辆以“吨位重”为主,小型车辆以“数量多”为主,这导致河南现有公路建设主要以改建、扩建为主,以
《拓荒者》创刊于1930年1月,是由原太阳社成员在《新流月报》的基础上创办的一个左翼刊物,“左联”成立后,《拓荒者》从第三期开始被作为“左联”的机关刊物,发行至当年5月止,共出
目的探讨血清降钙素原测定对脓毒症患者病情及预后判断的指导价值。方法46例脓毒症患者按病情危重程度分为早期脓毒症组、严重脓毒症组和脓毒症休克组,分别比较组间PCT、CRP、
本文以某省会地铁轨道桥为研究对象,利用有限元分析软件ANSYS,对该地铁轨道桥预应力混凝土简支箱梁的力学性能进行分析,通过分析数据与工程实际要求设计值的对比,发现该结构设计