一种面向混合型数据聚类的k-prototypes聚类算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:lingling850502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高维混合型数据聚类中的特征加权问题,提出了基于熵权的分类型相异度系数,量化的数值型相异度系数和适用于混合型数据聚类的混合型相异度系数.提出的相异度系数充分考虑了分类型特征值的重要性和数值型特征值的平均值,并具统一的准则,可以更客观的计算数据对象与簇之间的相异度.此外,将加权的混合型相异度系数应用到经典的k-prototypes算法中,提出了一种面向混合型数据聚类的k-prototypes聚类算法(KPMD).使用UCI真实数据集进行实验,结果验证了KPMD算法的有效性和鲁棒性.
其他文献
股利政策代理理论认为股利政策可以解决由于所有权和经营权分离产生的代理问题,但这一结论是建立在西方资本市场之上的。本文从中国上市公司的实际出发,从代理理论的角度分析我国上市公司股利政策。在理论方面,本文主要从企业代理理论的视角,分析了现代企业存在的不同利益主体间代理冲突问题。在现金股利无法自动解决代理成本问题时,应发挥债务融资的公司治理效应,促进公司治理水平的提高、减少代理成本和保护中小投资者利益。
期刊
随着农业航空技术的发展,自主化作业方式成为了目前农业航空领域的研究热点.植保无人机是一种集成了通信技术、自动控制技术、传感技术以及地理信息定位技术等多种相关技术的智能农业设备,用植保无人机进行喷雾作业具有效率高、速度快等优点,并且无人机能够在没有跑道的小型区域内垂直起降,能够很方便的在各种地形上进行喷洒作业.针对含障碍作业区域,提出了一种无人机航线设计算法,算法分为路径点采样以及路径点排序两部分.
期刊
问答匹配是社区问答的一项重要且具有挑战性的任务.本文提出了一种面向社区问答匹配的混合神经网络模型.针对问答对序列,提出了融合卷积神经网络(CNN)与双向长短期记忆网络(B
改革开放三十年来,我国企业得到了长足的发展,然而企业间的市场竞争日益加剧,而当前的金融危机更是对企业的发展提出了严峻的挑战。这种状况客观上为管理咨询的发展带来了广阔的
学位
夏志祥说自己走回来.这话他是对前妻说的,在监狱的犯人接待室里.那鬼地方夏志祥难得去,没人来看他,他也不想谁来跟他隔着铁栏杆东拉西扯点啥.弄不好边上还有人一把鼻水一把眼
方面情感分析是更细粒度的文本情感分析,传统的方法是采用长短时记忆神经网络和注意力机制相结合,但实际并未考虑到方面情感特征项与句子上下文之间的联系,并且在预训练阶段
不久,这个世界也会移动.rn你的风流韵事,它是什么?rn不过是茶壶里的一场暴风雨.rn--约翰·阿什伯利rn白天,火车站象园头有人被杀死了.rn晚间我又回到象园头,从塔桥方向过来.
期刊