基于粗糙集的多维数据聚类分析

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:KAI12321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,网络的普及,各种各样的信息资源充斥着网络。随着微博的推广,微博的用户在以每年数以亿计的速度增长。每个用户信息包含几十条的属性,应该如何划分微博用户,对数据挖掘提出了挑战。本文研究对多维数据集进行聚类划分时,使用粗糙集理论对数据集进行预处理,降低数据维度,消除重复数据,形成数据集,同时利用知识决策系统,求取属性核子集;再使用遗传算法,结合核子集对属性约简,得到最小属性约简,通过属性约简得到了数据集中的重要属性集合;最后,根据属性约简,采用聚类的距离特征,改进适应度函数,优化遗传算法,对数据集进行划分聚类,得到聚类结果。通过对新浪微博用户信息使用本文的数据挖掘方法,能够简便的获取数据集的聚类中心和数据聚类,为数据挖掘处理多维数据增加了一种方法。
其他文献
随着经济的发展和企业规模的扩大,企业对于信息化的投入逐渐增大,不同类型的系统被引入和运行。由于系统开发时间有差别,系统基于不同的开发平台、工具和语言,这样会导致系统之间
随着物联网的高速发展,无线射频识别(Radio Frequency Identification,RFID)技术的应用范围越来越广泛,快速多样化的发展对RFID技术的适应性、灵活性及可维护性有了更高的要求,RF
每年,数以万计学术论文的发表使得论文的规模达到了空前的高度。科研人员如何在众多的学术论文中找出感兴趣的论文成为困扰他们的一个棘手问题。早期,研究者主要运用传统的协
旋翼飞行机器人由于其垂直起降、定点悬停、低空低速飞行的飞行特性成为架空电力线路巡检的有效手段。电力杆塔作为输电线路最核心部分,对其图像数据采集的效果决定了整个巡检
云存储技术的发展使将文件存储在云端的人们的数量变得越来越大。人们将数据存储在云端的目的是为了节约存储设备的花费。那么如何保证数据在云存储中的隐私性和完整性就成了
词义归纳利用聚类技术自动从未标注语料中获取多义词的词义,从而大大提高语言工作者的工作效率。因此,词义归纳成为当今计算语言研究中一个最重要的课题。本文基于CLP2010提
光刻机系统中,工件台控制系统作为重要的子系统之一,完成工件台的控制和硅片的曝光过程控制。位于测量区的工件台需要与上下片系统、调平调焦系统进行协同工作,完成载片、卸片、
随着当今科技的进步与发展、网络规模在不断壮大,网络的这些特性(如分布性、复杂性、异构化和不合作化)越来越明显,这就加大了网络管理的难度;同时,人们提高了对网络服务质量的要
多功能一体机作为一种集打印、扫描、复印、传真等功能于一身的办公设备。因其节约成本、节省空间、提高工作效率的强大优势,迅速受到企业及家庭用户的青睐。近年来随着一体机
随着企业信息化建设的深入,山西移动同其他大型企业一样,面临来自管理支撑、技术架构和运营管理多维度的转型压力,客观上需要设计新一代企业信息架构以促进业务流程再造和业