基于信息熵降维的混合属性数据流聚类算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:vbpro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的数据流聚类算法无法处理高维混合属性的数据流。针对该问题,对HPStream算法的脱机聚类和联机聚类过程进行改进,利用频度矩阵处理名词属性,通过基于信息熵的名词属性选择方法降低数据维度。实验结果表明,该算法能有效处理混合属性和维度较高的数据集,与HPStream算法相比,聚类精度有5%~15%的提高。
其他文献
随着工业自动化水平的提高以及计算机技术的广泛应用,人们对工业自动化领域控制软件的通用性和灵活性提出了更高的要求。人们越来越重视系统软件的组态和配置功能。工控组态软
随着电力行业信息化的不断发展,信息安全面临日益严峻的考验。文章从适应新形势下电力调度系统发展和电力市场需要的角度出发,分析了电力信息网络的主要分类和特点,着重从技术和
学校教育质量的高低,从根本上讲,取决于教师队伍素质的高低和教师投入的多少。在教育体制创新过程中,要坚持以人为本,重在激励。制度约束是基本要求,激励才是最高要求。约束机制拉
在教学过程中,要体现学生的主体地位,教师应充分发挥学生在学习过程中的主动性和积极性,激发学生的学习兴趣.笔者就如何在英语教学中发挥学生的主体地位及教师的指导作用,谈
随着人类正加快步入信息时代,使得计算机技术得到了飞速发展。计算机技术的广泛应用,使人们越来越多地开始将将先进的计算机技术应用到我们捕捉到的图像上,并希望通过计算机图像
现行全日制普通高级中学《数学》高一年级下册中,设置了《平面向量》一章。向量是“形”与“数”的结合体,用来表示一个既有大小又有方向的量,是几何与代数知识的交会点。由于这
本文利用GPIB总线建立起了数字多用表的自动测试系统,通过它可以方便的自动多次测量交流电压、直流电压等量值,无需人工进行参与,可自动完成测试。
教学中,我们经常会有课堂教学效果差,学生们听课不积极等问题,究其原因,是对教与学的主体认识不到位造成的。新课标所倡导的教学理念是以学生为主体,一切的教学手段、教学方
伴随着知识经济的全面崛起和信息时代的悄然来临,高等教育的理念、职能、内涵和形态已经或者正在发生令人目不暇接的有意义的嬗变;大学在更大范围、更深层次上适应社会需要并
期刊
太原理工大学是一所具有百年办学历史的以工为主、多学科性的高等学府,是山西省唯一一所进入国家“211工程”重点建设的大学。其前身是创立于1902年的山西大学堂西学专斋,1953