一种基于信息熵的混合属性数据谱聚类算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:lovetheme1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的聚类算法只能处理单属性的数据,不能很好地处理混合属性数据的聚类问题,以及目前大多数混合属性数据聚类算法对初始化敏感、不能处理任意形状的数据的问题,提出一种基于信息熵的混合属性数据谱聚类算法,用于处理混合类型数据。首先,提出了一种新的相似性度量方式,利用谱聚类算法中的数值型数据构成的高斯核函数矩阵与新的基于信息熵的分类型数据构成的影响因子矩阵相结合代替了传统的相似度矩阵,新的相似度矩阵避免了数值属性与分类属性数据之间的转换和参数调整;然后,把新的相似度矩阵运用到谱聚类算法中,以便于处理任意形状的数据,最终得出聚类结果。通过在UCI的数据集上的实验表明,该算法能有效地处理混合属性数据的聚类问题,且具有较高的稳定性以及良好的鲁棒性。
其他文献
十年来,计算机在图形功能方面的进步十分迅速,可以用一日千里来形容,而推动这一进程的,则是已经成为娱乐行业一个重要的组成部分的游戏。来自对游戏视觉效果的推崇与追求,刺激了硬
由游工委发起,《程序员——游戏创造))杂志、北京递归开元教育等机构联手打造的“2008年游戏行业企业校园招聘启动仪式”于7月24日在北京中关村软件园胜利闭幕。
六师军户农场疫情防控战役以来,社会各界人士,时刻关注着农场一线防控人员的动态,积极为他们献出爱心,让疫情防控的路上更温暖。夫妻同筑爱心桥"老公,现在我们的党员干部为了
连日来,在九师一六四团疫情防控检查站、各居民小区防控卡点等重点防控要害场所,随处可见民兵不畏严寒、坚守在自己的岗位执勤值守,飒爽英姿。作为团场开展疫情防控的一支重
期刊
神州大地百年圆梦,奥运盛事举国欢庆之际,2008 ChinaJoy年度优秀游戏评选大赛——“金翎奖”评选活动也拉开了帷幕。经过几届的发展。“金翎奖”不仅仅成为与ChinaJoy同等重要
4月9日上午,新闻出版总署与教育部、公安部等八部委联合下发通知,于4月15日起推行防沉迷系统,7月16日起将在国内网络游戏中全面实施。新闻出版署音像电子和网络出版管理司副司长
大国工匠精神就是在某个行业或职业中通过"师徒制"所形成的爱岗敬业、精益求精的职业理念与工作态度,不仅在本国很有影响力,而且在世界上被广泛地学习和传颂;其精髓是注重细
麻醉药物是临床医疗活动中不可或缺的特殊药品,现有的麻醉药物种类众多,用法不尽相同,国家对麻醉药物的管理也极为严格。多数麻醉药物在连续大剂量使用后均会产生药物依赖性,
2007年游戏开发者大会(GDC2007)3月初已于旧金山落幕,除了一如既往的图形处理技术展示、游戏制作工具宣传和游戏开发技术讨论,本届大会还呈现出不少值得业界关注的新动向。比如随