基于熵的混合属性聚类算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:dragoonzj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决混合属性中数值属性与分类属性相似性度量的差异造成的聚类效果不佳问题,分析混合属性聚类相似性度量的问题,提出基于熵的混合属性聚类算法。引入熵离散化技术将数值属性离散化,仅使用二元化距离度量混合属性对象之间的相似性,在聚类过程中随机选取k个初始簇中心,将其它对象按照距离k个簇中心的最小距离划分到相应的簇中,选择每个簇中每个数据属性中频率最高的属性值形成新的簇中心继续划分对象,迭代此步当满足目标条件时停止,形成最终聚类。在UCI数据集上的实验结果验证了该算法的有效性。
其他文献
研学旅行作为一种新的课程形态,要实现由“校外活动”到“学校课程”的提升,必然要寻求与学科课程的有机融合。课程化嵌入是实现两者有机融合的应然路径。历史与社会学科研学
国有企业带动了我国教育、科技、工业等多产业的发展,特别是在“青年强则国强”的实践措施指导下,国有企业党建人员应当重视青年团队人才队伍的规划与建设,要求青年人才队伍
基层党组织是党在社会基层组织中的战斗堡垒,是党的全部工作和战斗力的根基所在。基层党组织的重要地位和作用,决定了加强基层党组织建设将成为贯彻落实科学发展观、永葆党的
为研究锚杆受拉拔荷载作用下渐进失效机理与锚固界面应力分布规律,基于四线性黏结滑移模型,考虑残余强度对剪胀和软化应力区域长度的影响,通过锚固单元受力平衡条件修正了前
针对带释放时间和运输时间的柔性流水车间问题,每个处理阶段含不相关并行机,且中间无缓冲,以最小化所有工件的加权完成时间之和为目标,提出一种基于遗传算法的EGA&LS优化方法
本文对洛栾、洛卢高速的视频监控系统数字化高清视频改造工程的设计思路进行了详细分析,对施工过程相关事项进行了说明,并对该项目实施的重要性进行了阐述。