基于一维SOM神经网络的聚类及数据分析方法研究

被引量 : 0次 | 上传用户:xymztttt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘领域中一个非常活跃的研究课题。自组织特征映射网络(Self-Organization Map,SOM)能够将输入数据映射到输出神经元阵列中,并保持数据集的拓扑结构和密度分布,使同类数据聚集在一起。自从SOM问世以来,人们对它的研究大多数聚焦在二维SOM上,对一维SOM的研究相对较少。直觉上,二维SOM比一维SOM能保持更多的数据集结构信息。但是,笔者发现,在把同类数据聚集在一起,把不同类数据完全分离方面一维SOM并不逊色于二维SOM。而且,在类边界识别、样本之间的相似关系表达以及类与类之间的相邻关系的表达方面,一维SOM比二维SOM更容易、更明确。为此,本论文开展了基于一维SOM聚类的系列实验研究。系统研究了一维SOM的聚类功能,着力开发出几个基于一维SOM的聚类分析方法。实验结果表明,一维SOM能像二维SOM一样对数据空间样本进行正确聚类。与二维SOM相比,一维SOM不但能保持原数据空间中类的线性可分性,而且能把数据空间中线性不可分的类映射为线性可分的类,使得一维SOM映射图中相邻数据和相邻类的关系更直观,类分界线的可视化更容易。通过系列实验,研究了神经元个数、训练参数与聚类结果之间的关系。提出了独立性、分散度和最大聚集度三个评价一维SOM训练和聚类效果的定量指标。找到了使一维SOM得到充分训练的参数取值范围。为开发基于一维SOM的系列聚类分析法奠定了基础。根据一维和二维映射图拓扑保持性的互补性,提出了基于一维和二维SOM组合图的聚类方法(CC-SOM)。使用该方法对三个典型数据集进行了聚类实验,结果表明,该方法不仅适用于球形类,对于结构复杂的非球形类也具有较好的聚类效果。针对高维大数据集聚类问题,提出了基于一维SOM最相似原型序列的聚类方法(MSPS-SOM)。实验表明,该方法具有较好的抗噪音能力和对大数据集的处理能力,能够较好地识别基于距离的类和基于密度的类。提出了样距图的概念,确立了样距图数据的获取程序和样距图的绘制及校正方法,找出了典型数据集结构特征与样距图或校正样距图形状特征的一一对应关系。在此基础上提出了基于一维SOM输出序列样距图的数据分析法(SDP-SOM)。实验表明,使用该方法不仅可以得到聚类结果,还能得到有关数据集的精细结构信息。
其他文献
目的:研究人乳头瘤病毒主要衣壳蛋白(HPV L1)在宫颈液基薄层细胞学(LPT)异常涂片中的表达,并结合组织病理学结果,探讨L1蛋白的表达与宫颈病变的关系,了解其能否作为辅助诊断
目的探讨医科大学生领悟社会支持与主观幸福感的关系。方法本研究随机抽取川北医学院553名学生作为被试,以班为单位,同时测试领悟社会支持量表和主观幸福感量表,对数据结果进
结合生产实践,从机械、电磁等方面系统阐述了2极中型异步电动机振动产生的原因,提出了可行的处理方法,如针对刚性转子与挠性转子的特点,提出的不同设计方案;针对滑动轴承电动
金庸的武侠小说可以视为一部对人性审视的范本,其中的故事情节蕴含了中华民族某些良好品质。这些小说,若用审美的眼光来看,不仅仅是作者对人生的体悟,同时也是作者对传统文化
从城市化与城市现代化角度对美国学界20世纪中国城市研究进行考察与分析发现,美国学界对1949年前中国城市研究固然不少,然而有关同时期城市化专题研究却非常少,有关1949—197
我国资本市场起步较晚,发展落后。与美国等发达国家不同,我国的债券市场规模远逊于股票市场。由于一些特殊的原因,目前我国企业债券市场的发展还远不尽如人意,不论在发行总量
英语教学领域中的改革和其他教育领域中的改革是同等重要的,都是我国教育事业发展过程中的必经之路,在此背景下科学合理地应用建构主义理论,可以在英语教学改革中起到一定促
美学成为一门独立的学科的时间并不如哲学长,但在哲学初始之际,人们的审美意识就已然存在并随着哲学的进步而进步。儒家、道家与古希腊的哲学流派虽然分属于东西方,在思想的
本文主要阐述什么是节奏?以及客观存在的自然现象为一切艺术节奏的产生提供了一个必不可少的前提,也为音乐的节奏提供了素材,成为人们理解音乐节奏的内在条件。阐述了音乐中的节
<正>我国农业正处在传统农业向现代农业转型的关键时期,培育新型经营主体,是实现农业战略转型的关键所在。党的十八大报告指出:"培育新型经营主体,发展多种形式规模经营,构建