基于云模型和数据场的聚类研究

来源 :重庆交通大学 | 被引量 : 0次 | 上传用户:hnwkn2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着“互联网+”在各行业不断的普及和发展,大数据思维正逐渐影响着人们的思考方式,领导者们依据数据作决策已成为常态。然而当前的大数据具有数据量大、类型繁多、变化快、价值密度低等四大特征,要想从中提取有价值的信息,就需要进行大数据分析,而大数据分析的核心任务是聚类。聚类是指根据数据自身的结构信息,将其划分成多个类,使得每个类内部相似度较高,不同类之间相似度较低。经典聚类算法如k-means、DBSCAN、密度峰值DPC等聚类算法都存在着不足,或是对噪声点敏感,或是需要用户输入参数。为了能克服上述算法各自的缺点同时又能继承每种算法的优点,本文在传统聚类算法的基础上,通过引入云模型和数据场提出了一种新的自适应聚类算法。该算法能够处理任意形状分布的数据集,抗噪声能力强,能够处理高维数据,且整个聚类过程不需要人为输入参数。本文的主要研究内容如下:1、改进数据场中势函数计算公式,将3σ距离以外的势值定义为零。改进后的势函数能准确找出噪声点,且降低了算法的时间复杂度。2、针对数据场中的参数σ,本文给出了两种参数选取方法,并提出用黄金分割法计算最小熵,自动获得最佳参数σ。3、根据本文算法中聚类中心的性质,提出了一种自动检测最佳聚类中心的方法。4、以改进的数据场为基础,提出了一种自适应聚类算法,整个聚类过程无需人为干预,解决了经典聚类算法对人为输入参数的依赖性。该算法通过计算每个对象的势值,找出聚类中心和噪声点,然后将其他对象按势值划分到最近邻的簇中,从而完成整个聚类过程。5、通过对聚类问题中的经典数据集实验仿真,验证了本文算法对任意形状分布的数据集的聚类能力。且与k-means、DBSCAN、DPC算法进行了对比,验证本文算法具有较好的聚类效果。6、针对现有数据的高维度性,提出一种基于云模型的特征提取方法。该方法利用逆向云发生器计算原始数据的三个数据特征,然后将三个数字特征作为主要特征进行聚类分析,并在三个高维数据集上验证了该方法的有效性。
其他文献
随着网络应用技术的飞速发展和安全需求的不断增长,无线传感器网络源节点的位置隐私问题逐渐引起学者的关注,特别是基于随机路径和地理位置路由的安全方案。然而现有的基于随
在当前移动通信迅捷发展的背景下,随着智能手机、无线电脑等智能设备的普及,人们对于无线视频传输的需求越来越高,也更希望能够随时观看质量更好的视频,也因此人们对于无线视
软件定义网络(Software Defined Networking, SDN)的出现为网络的灵活管理提供了一个巨大的机会,也为网络路由算法的创新提供新的契机。随着SDN在实际大型网络拓扑以及广域网
随着物联网技术的不断发展,越来越多的传感器探测设备进入人们的视野,有些传感器能监测所处环境的温湿度,有些传感器能探测到远距离移动的目标,也有些传感器能实时的看到真实
基于视觉的目标检测技术可以被直接地应用到视频监控、安全驾驶、人机交互和互动娱乐等领域中,具有广泛的商业应用价值和市场前景,因而一直是计算机视觉和图像处理领域中的研
SDN (Software Defined Networking,软件定义网络)成为未来网络发展的重要方向之一,核心思想是实现控制与转发分离以及开放的可编程性,并不断优化和重构现有网络。SDN可靠性
大规模天线系统被认为是下一代5G通信的关键技术之一。在接收端配置有大规模天线阵列,大规模天线系统可以实现非常高的频谱和能量效率。大规模系统面临的一个挑战是对信道状
现在人们非常依赖智能手机,几乎天天都在使用,这使得智能手机中有很多隐私信息。苹果公司的iOS系统是当前最流行的手机操作系统之一,由于其内置的代码签名和应用程序审查等机
由于无线通信网络的开放性,使得传输信息被窃听的风险成为了一个非常值得关注的问题。物理层安全技术作为一种可以有效保证通信安全的技术,最近吸引了通信界的关注。物理层安
随着移动互联网时代的到来,无线通信系统需要为人们提供更高的可靠性、更广的网络覆盖范围以及更大的系统容量。中继MIMO通信系统依靠其多天线的特点,可以更高效的发挥中继站