复杂仿真数据的降维与可视化聚类方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:mmghb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,仿真系统的复杂程度越来越高,随之仿真数据也出现高维、数据量激增、包含随机性和人为性等不确定因素等特点,经典统计理论在分析这些数据时暴露出了一系列问题。随着计算机硬件技术的发展和数据挖掘理论的兴起,基于数据挖掘技术的复杂仿真数据分析逐渐进入了研究人员的视野,论文基于可视化数据挖掘技术,对大规模、高维数、相互关系复杂的仿真数据的可视化聚类及相关问题进行了研究,具有一定的理论和工程意义。针对专家估计法对复杂仿真数据可视化前的特征选择,可能造成忽视专家个人差异及数据自身特点的问题,提出了基于模糊综合评价模型的主客观估计法。首先构造专家模糊评判矩阵,并根据专家在行业的影响力确定权重,进行主观模糊综合评价;然后根据数据自身特点计算属性的信息熵,获得客观评价;最后将主观评价和客观评价按照不同比例进行综合,从而确定属性的重要程度。针对复杂仿真数据可视化前的数据降维问题,分析了常用的流形学习降维方法;证明了局部切空间排列算法(LTSA)与核主分分析方法(KPCA)本质上的一致性;提出了基于核的LTSA算法对增量仿真数据降维的改进。经实验验证,该改进算法与LTSA算法相比能达到同样的降维效果,并且具有更高的运行效率。针对复杂仿真数据降维中需事先提供维数的问题,采用改进的极大似然估计法进行本征维数估计。首先分析了极大似然法存在的缺点,提出利用测地线距离代替欧式距离的方法,来解决错误近邻点选择问题;提出对各局部估计的本征维数以密度修正代替平均值的方法,来解决估计结果受奇异值影响过大的问题。针对复杂仿真数据可视化聚类问题进行了研究,提出两种可视化聚类方法。在基于改进雷达图的可视化聚类方法研究中,首先对传统雷达图进行了改进,为突出数据特征,以属性权重确定极角,以属性值确定极径;又对k-means算法中存在的随机确定初始中心点而无法得到最优解问题,提出了优化初始中心点算法;针对算法必须事先给出聚类个数,而实际难以做到的问题,提出采用循环和专家监督干预的改进方法。在基于自组织映射的可视化聚类方法研究中,将传统的矩形或六角形方格中的神经元映射改变为雷达图映射,解决了传统SOM映射中无法反映数据点差距的问题;通过增加横向收缩力,重构权向量,加速了映射点的收敛时间;提出利用随获胜神经元到邻域神经元间距单调递减的函数作为修正值的自适应学习速度改进,来增加算法的稳定性和收敛时间。经实验验证,该算法具有更高的效率和鲁棒性。论文丰富了高维数据降维、可视化数据挖掘的方法,为复杂仿真数据分析方法提供了新的技术支持。
其他文献
介绍了自行设计的恒压供水系统,采用PLC进行逻辑控制,有用变频器进行压力调节。变频器、可编程控制器作为系统控制的核心部件,时刻跟踪管网压力与给定压力的偏差变化,经变频器内
通过石质深孔人工挖孔桩成孔及护壁处理的施工实践,介绍了人工挖孔桩的施工工艺、护壁设计及计算和安全防护措施等。
世上万物都是相对的,一个忍字,有积极的一面,也有消极的一面。善者忍之则为慈悲,恶者忍之则为残暴。世俗的忍辱有君子报仇,十年不晚之意,就是心中怀有怨恨。 那么佛教的忍辱
生鲜食用农产品的特性使其供应链和物流管理成为热点和难点问题。我国农业生产的农户家庭化、国民膳食风俗习惯与大众消费的"菜市场化"是我国生鲜食用农产品供应链体系复杂的
西班牙和意大利高速铁路隧道施工管理严格,工艺细致,机械化程度高,安全事故少,施工质量好,其列控系统的发展方向是采用ETCS2,它一般用于高速新线建设,满足最高350km/h运行速
目的 探讨在泌尿系疾病中进行 3DCT重建时的技术因素。方法 回顾分析 5 3例 (正常肾 5例 ,正常输尿管 4例 ,泌尿系疾病 44例 )成功进行了泌尿系 3D重建的资料。CT扫描使用P
本文对地铁机电设备安装监理进行了阐述,具体从(风、水、电)的施工人员、材料、设备进场前的准备、施工过程、竣工验收前的设备调试、联动试车监理进行了详细分析,验证了监理
<正>"农村将来会成为稀缺资源,会成为城里人向往的地方。"农业部部长韩长赋去年两会答记者问时说。乡村旅游已成为我国旅游消费的重点领域,乡村民宿成为乡村旅游的新热点。调
油池火灾燃烧迅猛、危害极大,燃烧时释放大量热量,扑救难度大。因此,日常的扑救演练变得尤其重要。传统消防演练花费高、复用性差、形式单一,本文立足于虚拟现实技术,对油池