改进的混合属性数据聚类算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:liongliong573
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
k-prototypes是目前处理数值属性和分类属性混合数据主要的聚类算法,但其聚类结果对初值有明显的依赖性。对k-prototypes初值选取方法进行了分析和研究,提出一种新的改进方法。该方法有更高的稳定性和较强的伸缩性,可减少一定程度的上随机性。实际数据集仿真结果表明,改进算法是正确和有效的。
其他文献
本文报告了自1991年以来对小学生进行口腔卫生健康教育干预实验的中期评价。结果显示实骚组干预前后,在有关认知、行为和口腔卫生状况各方面都发生积极变化,而对照组无相应变化
实验观察,EM釉质粘合剂、京津釉质粘合剂和光固化树脂与硬质树脂贴面的边缘封闭性要高于釉质粘接的边缘封闭性,三种粘结树脂的边缘封闭性相同。三种粘结剂粘接硬质树脂贴面的微漏
网络安全事件的源头产生于内网的情况越来越多,保障内网安全的前提和基础是网络准入技术。目前,实现网络准入有多种方法,从这些方法出发,不同的IT厂商各自推出了不同的实现方
小学阶段是学生形成良好个性的关键阶段,同时又是养成良好习惯的重要时期,因此,家校互动协作也是十分关键的.家长会是教师与家长双向沟通的重要平台,深受广大家长以及教育者
模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上,指出它在处理数值型和分类型混合数据时的不足,进而提
针对具有内部参数不确定性和外部扰动的海上船舶设计了航向自抗扰控制器,并解决了舵机模型中舵角的限幅和限速问题,基于滑模控制理论提出了反馈控制带宽的计算方法.采用频域
该文基于河北省桃产业一二三产业融合发展实践的调研,提出当前河北省桃产业一二三产业融合的4种主要模式,包括区域多产业融合模式、桃园综合体模式、电子商务引领模式和桃园
新闻传播可以为农村经济发展提供科技推广渠道、文化和政治支持,促进农村经济市场化发展。分析了新闻传播在农村经济发展中的作用,提出了发挥新闻传播在农村经济发展中作用的
由于烟包印刷利润相对较大,所以大量印刷企业纷纷涉足烟包印刷行业.目前,全国以烟包印刷为主的印刷企业已有200多家.其中大多数企业以凹印为主,竞争日趋激烈。
明显陵座落在湖北钟祥距其城东不远的纯德山,明朝嘉靖皇帝其父亲和其母亲合葬在此陵,始建于明正德十四年,历时数十年建成。我国明代陵中单体面积所涵盖的最大的皇室寝陵。本