【摘 要】
:
DNA微阵列产生巨量的表达谱数据,用以挖掘特定的生物信息,而对表达谱数据的分析离不开有效而可靠的聚类算法。现有的聚类方法都是把具有相似表达模式的基因或样本归为一类,而
论文部分内容阅读
DNA微阵列产生巨量的表达谱数据,用以挖掘特定的生物信息,而对表达谱数据的分析离不开有效而可靠的聚类算法。现有的聚类方法都是把具有相似表达模式的基因或样本归为一类,而微阵列数据的高维小样本特点,致使基于DNA微阵列的聚类算法是在超高维的空间中进行的,从而产生了维数灾难问题。本文从另一个侧面入手,注重基因之间或样本之间的关系,提出了一种新颖的聚类方法。该方法把经典的基于相关的DNA微阵列数据聚类分析方法和图论知识相结合,能更好地揭示基因或样本之间的相似性,且避免了维数灾难问题。把本文方法运用到真实的DNA微阵列数据(Yeast数据和NCI数据),并与其他的聚类方法进行了实验比较,实验结果显示,本文方法获得了较好的聚类效果。
其他文献
未来的无线网将包含各种不同类型的接入技术,不同类型的无线网所提供的网络带宽和覆盖范围是各不相同的。如何利用这些异构的无线网提供无缝的漫游服务是一项颇具挑战性的工作
目前,作为数据仓库技术与GIS技术相结合的产物—空间数据仓库技术,已在测绘、交通、市政、航空航天等领域中逐步得到应用与发展。空间数据仓库技术是数字地球、数字城市建设
灌溉工程建筑物是水利工程设施之一,对促进我国农业发展起着极其重要的作用。灌区既是灌溉工程的建筑物,又是水资源调配的执行者。由于灌区规模大、管辖范围广,人员技术力量薄弱
多色点集划分研究的是如何将含有不同颜色点的平面划分为各个区域,每个区域中只包含一种颜色的点。这是计算几何中的一种组合优化问题。但是现有的多边形划分方式所得到的结
为了保障人类的健康,药品在投放市场前必须进行药理毒理性试验,特别是用于测量药品毒性的血液生化分析实验。血液生化分析实验要对大量的血项指标数据进行统计分析,目前的统计分
在图像的成像、数字化、压缩和传输等过程中难免会有各种干扰,形成图像噪声。为了使图像的后续应用得到更好的结果,在处理图像前一般都要进行降噪预处理。现有的图像滤波方法
随着Internet技术的飞速发展,分布式存储技术取得了长足的进步。同时,日益增加的用户和数据,也给分布式存储技术带来了新的挑战。另一方面,随着P2P计算模式的兴起、网络带宽的大
降低软件系统开发成本,提高开发效率是企业软件开发不断追求的目标。从技术角度来说,提高软件的复用效率,采用更先进的开发工具是提高开发效率的有效手段。 目前,国内部分空调
关键词识别是语音识别研究中的一个重要领域,其目的是从连续语音中检测并确认给定的若干个特定关键词。跟关键词识别相比,目前连续语音识别有资源耗费大,速度慢,抗噪能力不强等缺
随着互联网技术的迅速发展,越来越多的Web应用出现在人们生活的各个领域。这些独立的Web应用分散在Internet上,实现特定的业务功能,通过浏览器就能方便地进行使用。当开发新的We