一种基于混合数据相似性度量的谱聚类算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:todaynow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,人们在生活中产生了大量的数据,其中部分数据具有数值型和分类型两种属性类型.现有的大多数聚类算法只能处理单一属性类型的数据,对这种混合属性的数据往往难以处理.针对这个问题提出一种基于混合数据相似度测量的谱聚类算法,首先对两种属性数据分别进行相异度度量,然后用一种相似性度量表示出混合数据之间的相似性关系,把相似性关系映射成无向图两顶点之间边的权值,最后通过谱聚类算法实现聚类划分.从UCI标准数据集选取几个混合数据集进行实验,并与其他算法进行了比较,验证了本算法对混合数据聚类的有效性.
其他文献
随着城市现代化发展的飞速进行,湿垃圾的数量也急剧增长,但湿垃圾无害化处理率却跟不上垃圾的增长率,如何有效的对湿垃圾进行无害化处理和资源化处理成为每一个城市急需解决
聚类集成通过综合多个聚类结果得到最终的类簇划分,在保证与每个被集成的聚类结果尽量一致的前提下,提高了聚类算法的稳定性.但是目前少有专门针对二支决策聚类结果集成为三支决策聚类结果的集成方法,而三支决策以其更符合人类认知与决策模式的优势正被学术界广泛研究.为此,提出一种新的基于三支决策的聚类集成方法,并用区间集的形式表示最终聚类结果,即用区间集的下界、边界与上界分别表示聚类结果中类簇的正域、边界域和负
在李尧看来,虾料市场天花板远没有触顶。在面对群雄争霸以及地方诸侯割据的局面时,作为水产行业的后起之秀,李尧还将带领年轻的华北大北农杀出重围,继续抢食华北虾料市场这块蛋糕
期刊
提出了一种新的电压稳定控制方法.基于帕雷托优化解集,多目标决策技术被用来实现对于电力系统电压稳定性的柔性控制.电压控制是一个多目标优化问题.首先用基因跳跃进化算法作
提出采用“过程中点”计算法 ,减少计算误差和提高系统可靠性 ;解述“过程中点”计算方法 ;计算喷放终点压力 ,预防管道堵塞现象 Proposed “mid-point” calculation metho
最近几年,为了满足社会生产发展和人们日常生活之需要,我国配电网建设规模日趋扩大,变电站建设数量日益增多.电气工程作为变电站工程重要组成部分之一,主要为电力系统中电能
期刊
如今,Web业务平台已经在电子商务、企业信息化中得到广泛应用,很多企业都将应用架设在Web平台上,Web业务的迅速发展也引起了黑客们的强烈关注,他们将
体验是人类对一些事物感知的一种心理反应,有着很强的主观感受和感情色彩,让学生进行直观感受,能够更好地认识所学内容.在课堂教学中,教师要善于开展体验学习,引导学生自主探
节能环保建筑装饰工程体系的有效构建,既能够确保当前建筑工程环境满足城市经济和功能可持续发展的需求,真正巩固建筑工程施工优势,又能够凭借节能环保措施优化功能使用环境,