基于簇内簇间相异度的k-modes算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:wgsgdy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高k-modes算法的精度并解决初始簇中心选择问题,提出一种基于簇内簇间相异度的k-modes算法(IKMCA)。基于簇内簇间相似性对相异度系数进行改进,给出初始簇中心自主选择的具体方法。提出的簇内簇间相异度系数考虑特征值本身的相异性与其它相关特征对它们的区分性。提出的初始簇中心自主选择方法可以自动确定聚类个数和初始簇中心位置。实验结果表明,提出算法在聚类精度、纯度、召回率上均优于经典k-modes算法及其变体算法。
其他文献
在中国住宅建筑拆风盛行和健康发展的背景下,如何让室内空间更好满足居住者生活需求的个性化、多样化,成为了当代居住建筑设计的重要研究课题。本文基于空间以人为本的因人而异、因需而型、应需而变的住宅可适性思想,以套内空间全自由的可再生居住细胞A住宅为例,对相同住宅结构单元内的不同住户生活需求及其不同时间需求变化展开空间的多样可能性设计探索,并由此总结归纳出开放式住宅套内空间可适性的设计特征和设计模式。
在节点能量有限的前提下,为提高整体网络的使用时长,设计一个高效节能的无线传感器网络路由算法。通过分析无线传感器网络的运行模式,引入能量模型及传输模型,在此基础上提出BTPHS算法。将网络生存期分为3段,针对网络不同时期的能量分布及能量消耗特点,提出两种新的节点选择策略,提供新的目标函数作为参考标准;抛弃HS算法的调整过程,使所提出的路由算法参数更少。仿真结果表明,BTPHS算法可以有效提高整体网络的生存时间。
针对传统谱聚类算法在路网划分时承载路网信息较少和聚类中心优化问题,提出一种基于改进谱聚类算法的城市路网划分算法。通过转移概率模拟交通路网动态运行特征,利用马尔可夫链对谱聚类相似图进行重构,增强相似图的健壮性,与遗传算法结合,通过遗传算法优化初始聚类中心,提高谱聚类全局寻优能力。实验结果表明,改进后的算法比基准算法具有较好的聚类效果,能够有效划分城市路网。
新文科建设的提出为新时期家居设计类人才培养目标指明了新方向,建立健全具有中国特色与新时代特征的应用型人才、复合型人才、创新型人才培养方案是家居类教学体系改革的重要方向。当前新文科背景下的家居设计类专业教学内容存在实践课程建设不到位、协同育人机制不健全、“复合型”教学体制不完善等问题。本文以培养推动社会经济发展与家居产业变革的高素质人才为目标,结合新文科背景下的跨学科、跨领域、跨时代的思想路径,探究构建其课程体系、评价机制、教学团队构建、创新型人才培养机制的具体路径,以期为新文科背景下的家居设计类人才体系建
针对远程过程调用(RPC)系统无法支持响应式流编程(reactive stream)的问题,设计并实现基于响应式编程的RPC系统。采用基于响应式编程的Reactor-netty组件作为RPC底层通信框架,采用Zookeeper作为系统的注册中心,集成Kryo作为通讯序列化方式,设计并实现一种动态的负载均衡方案,针对java原生串行外设接口(SPI)功能进行优化,为RPC框架提供扩展机制。测试结果表明,该方案相较以Netty作为通信框架的RPC系统在性能方面有一定提升,该系统支持响应式方法的调用,适用于Ja
针对现有低压宽带电力线通信网络拓扑不均衡问题,提出一种宽带电力线通信网络最优中继选择算法。从入网申请节点到中央控制器所有路径中选择信噪比最高的路径,使节点选择最合理的中继节点;利用信标报文丢包率记录节点间通信状态,使节点分布更加均衡;以公有中继节点为顶端节点建立倒V型中转策略,提高数据传输效率。实验结果表明,该算法在平均端对端时延、网络控制开销、数据传输成功率等性能上优于现有技术。
为同步选择具有相关特征的数据聚类数量,提出一种基于引力搜索机制的聚类和特征选择算法。设计一种代理表示策略实现聚类中心和特征数量的编码;提出一种动态临界值方法决定聚类和特征数量,通过代理适应度的不断评估寻找最优聚类量和相关特征;分析算法的时间复杂度,通过8个经典数据集测试算法性能,并与7种常规数据聚类算法作对比。实验结果表明,所提算法在聚类和特征数量选择上具有更高的准确率。
针对大型网络中社区发现优化方法的效率问题,提出一种局部社区发现方法(LRW-LSA),从少量种子节点中识别本地社区的所有潜在社区成员。采用限制性随机游走进行采样处理,从种子节点出发得到一个相对较小的子图;利用种子的归一化指示向量对子图进行Lanczos迭代,得到相关节点与目标社区的隶属概率用以恢复出目标社区。在不同领域的真实数据集和合成数据集上进行实验,结果表明,LRW-LSA优于现有的社区发现方法。
针对网络攻击检测准确率较低的问题,提出基于人工神经网络和遗传算法的混合网络攻击检测算法。将多目标遗传算法和多项式逻辑回归模型组合成封装特征选择算法,利用多项式回归模型对多分类数据的高效学习能力以及多目标遗传算法的全局优化能力,提取数据的最优特征子集;将降维后的特征集送入感知机训练,利用重引力搜索算法搜索神经网络的参数。基于不同的网络数据集完成实验,实验结果表明,该算法有效降低了特征维度,实现了较好的检测性能。
提出数字语音信号的FDCR(frequency domain coefficient residuals)特征,分析该特征对信号处理操作的鲁棒性和恶意攻击的脆弱性。将语音信号分帧、帧号映射为二进制的水印序列,通过量化FDCR特征的方法将水印嵌入到载体信号中。提取端通过判断提取帧号是否完整来对各帧内容进行取证,篡改定位。实验结果表明了该算法的不可听性、鲁棒性以及对于恶意攻击的篡改定位能力。