基于自组织映射网络的数据挖掘算法研究及应用

来源 :上海大学 | 被引量 : 0次 | 上传用户:xinhongwei678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在最近的二十年里,电子格式存贮的数据以惊人的速度激增,形成了海量的数据和信息。数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术,包括统计学习和人工神经网络等方法。 自组织映射网络是一种无监督学习的神经网络,在拓扑保持的同时,可以将高维的输入数据以低维的形式表达出来,故SOM可以作为一种可视化的方法,适用于对数据进行分析以提取有用的信息,由于SOM的这种特性,在数据挖掘中广为应用。在本文中我们提出了一种用来进行数据分析聚类的新型自组织映射网络——GrowingHierarchicalSelf-OrganizingMap(GHSOM),它的特点是不需要预先获知关于数据集的任何信息,在聚类的同时也将数据集的层次结构呈现出来。 为了检验GHSOM对数据集类别和层次结构的揭示能力,我们使用GHSOM对高维数据——小鼠中枢神经系统数据集和酵母细胞周期数据集进行聚类和分类处理。最后通过与其他聚类算法的比较,说明了GHSOM本身具有比较理想的数据处理能力。 本论文的主要贡献为:1)提出了一种新的自组织映射算法GHSOM; 2)将GHSOM应用于微阵列数据的分析,来检验算法的有效性。
其他文献
小额支付系统和大额支付系统都是中国现代化支付系统的重要组成部分。2005年,大额支付系统完成了在全国的推广应用,它主要为企事业单位办理规定金额以上的贷记业务。为了进一步
目前,在一个大的组织内,各个基层部门在Internet上已经建立了大量的信息管理系统,然而这些系统之间缺乏信息共享,形成了“信息孤岛”。在研究解决信息孤岛方面,现在主要研究的是一
传感器网络是由分布于海陆空天多维战场的各类传感器、信息源,依靠一定的硬件和通讯协议连接起来的数据采集系统。它包括分布于海陆空天多维战场的各类传感器、信息源,以及实现
在数据库领域中,越来越多的数据通过图结构的方式进行存储,比如社交网络、生物信息学以及XML数据等。针对这些图数据的查询,很多时候需要更强大的计算机资源进行处理。为解决
软件产品的不断演化常常导致其质量的退化,从而增加项目管理、维护和测试的难度。软件开发和演化过程中的各种过程数据(例如代码提交记录、代码度量、bug报告及处理记录等)反映
随着因特网的日益普及,多媒体信息交流达到了前所未有的深度和广度,但作品侵权也随之更加容易,篡改也更加方便,因此,如何保护作品版权已受到人们的高度重视。数字水印作为数字图象
集成毛细管电泳芯片(IntegratedCapillaryElectrophoresisChip,ICEC)属于微流控芯片(micro-fluidicchips)研究领域,是分析化学、机械、电子计算机、生命科学等,多学科交叉的产物
人耳识别是一种新的生物特征识别技术。人耳(尤其是外耳)具有结构稳定丰富、不受面部表情的影响、更容易采集、更容易为人接受、不容易欺骗等优点,因此人耳识别正在成为生物特征
随着计算机技术和网络技术的迅速发展,Intranet技术广泛应用于社会的各个领域,大量的企事业单位都组建了自己的内网(Intranet)并接入了互联网,但敏感信息的泄露、计算机病毒的泛滥
体表心电图是临床诊断、治疗的重要工具,但是,由于人们不能全面了解体表心电信息与心脏工作状态之间的对应关系,使得心电图在心脏疾病的临床诊断中受到很大的限制。随着分子