基于熵与邻域约束的模糊C均值改进算法

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:hiketty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对模糊C均值(FCM)聚类算法没有考虑样本不同属性的重要程度、邻域信息等问题,提出一种基于熵与邻域约束的FCM算法.首先通过计算样本各属性的熵值来为各属性赋予权重,结合属性权重改进距离度量函数;随后根据邻域样本与中心样本间的距离计算邻域隶属度权重,加权得到邻域隶属度,利用邻域隶属度约束目标函数,修正隶属度迭代过程,最终达到提升FCM聚类算法性能的目的.理论分析和在人造数据集、多个UCI数据集的试验结果表明,改进后的算法在聚类效果、鲁棒性上均优于传统FCM算法、PCM算法、KFCM算法、KPCM算法和DSFCM算法,表明了本文算法的有效性.
其他文献
对于许多在线电商,预测用户购买商品的可能性至关重要.由于用户与商品的交互通常是高维且稀疏的,所以深度因子分解机算法(DeepFM)将因子分解机算法(FM)与深度神经网络(DNN)结合在一起,用FM处理低阶特征组合,用DNN处理高阶特征组合,通过并行的方式组合这2种方法,很好地解决了高维稀疏的问题.但是,它忽略了用户购买商品的先后性问题,也就是时间上下文信息.针对这一缺陷,本文提出一种融合注意力(Attention)与DeepFM的时间上下文推荐模型(DeepAFM),更好地利用用户与商品交互的时间上下文信
工作流的柔性问题已成为工作流系统适应业务需求不断变化的重要问题.工作流系统的应用分为建模阶段和运行阶段.现有工作流系统的静态路径已无法适应当前企业业务过程路径多变的需求,本文通过研究相关的理论方法与技术方案,分析运行阶段的路径变更问题,来提高工作流的柔性特性.本文对现有工作流路径回退算法进行改进,使其支持并行多步回退,解决工作流系统的动态路径问题,此外,还对当前大量应用的审批会签功能进行分析,提出一种运行中动态增加并行分支的解决方案,进一步提升工作流的路径柔性.最后结合实例进行验证,测试结果表明,系统能够
当前,缺陷跟踪系统通过缺陷报告实现缺陷与修复者的匹配.然而,以往的缺陷分派模型过于依赖缺陷报告的文本质量,引入自然语言中大量的冗余信息,并忽略了缺陷报告的元字段作为标签属性时存在于修复者之间的社区关系,使得模型结果表现较差.针对以上问题,本文提出一种基于多头自注意力机制的深度缺陷分派模型MSDBT(Multi-head Self-attention Deep Bug Triage).对缺陷报告的文本内容以及根据元字段生成的修复者序列进行向量化;通过多头自注意力机制在内部的输入元素之间进行并行注意力计算.在
传统基于机器视觉的药片缺陷检测方法中,药片图像多为单摄像机从药片的正上方进行拍摄,该方法难以对上下表面间断裂以及厚度不合格的药片进行有效的检测,该类缺陷药片在厚度上与标准药片可能存在着一定的差值.针对这种情况,本文提出一种基于双目视觉的药片厚度检测方法.该方法将双目摄像机放置于药片正上方,并采集药片图像,采用Canny算子提取图像中药片的边缘特征进行立体匹配,利用双目视觉的三角测距原理计算药片的视差,根据视差计算药片的深度信息,计算标准药片和缺陷药片的深度差,检测出存在厚度缺陷的药片.实验测量结果精度达到
随着云技术的不断发展和普及,为了更好地利用云平台的优点和特性,云原生应用服务不断涌现,如何利用云平台的特性来服务软件设计和开发成为了难题,例如如何利用云平台的弹性伸缩特性.云原生目前主流的容器编排技术Ku-bernetes支持自动伸缩,却存在一些需要针对具体情况进行优化改进的问题.本文主要针对使用Kubernetes编排的5G核心网网元PCF(Policy Control Function)的水平自动伸缩进行研究,通过基于自定义的负载数据(CPU使用率、内存使用率、交易量、带宽使用率)统计,根据历史负载数
森林火灾、野火是一个重大的自然灾害问题,每年全球各地植被都会受到严重的破坏.为了提高森林火灾的防控精度,针对传统方法具有火灾背景复杂、准确率低、效率低等问题,本文提出一种基于CenterNet的森林火灾检测算法.CenterNet作为一种无锚的方法,将目标定义为一个点,通过关键点估计定位目标的中心点,可以有效避免小目标的漏检.同时基于高效深层特征提取网络ResNet50,融合ECA模块以抑制无用信息,增加模型的特征提取能力.在公开森林火灾数据集上进行实验表明,与其他算法相比,本文提出的森林火灾检测算法误检
传统的池化方式会造成特征信息丢失,导致卷积神经网络中提取的特征信息不足.为了提高卷积神经网络在图像分类过程中的准确率,优化其学习性能,本文在传统池化方式的基础上提出一种双池化特征加权结构的池化算法,利用最大池化和平均池化2种方式保留更多的有价值的特征信息,并通过遗传算法对模型进行优化.通过训练不同池化方式的卷积神经网络,研究卷积神经网络在不同数据集上的分类准确率和收敛速度.实验在遥感图像数据集NWPU-RE-SISC45和彩色图像数据集Cifar-10上对采用几种池化方式的卷积神经网络分类结果进行对比验证
在射频识别系统中,标签用于传递信息,在阅读器有效作用范围内,多个标签同时响应从而发生碰撞的情况不可避免,标签发生碰撞会降低系统的识别效率.为了提高系统的标签识别效率,本文在已有防碰撞算法的基础上提出一种基于ALOHA分区的多周期防碰撞搜索算法.该算法首先根据待识别标签数目划分相应时隙帧长,然后在发生碰撞的时隙内利用多周期防碰撞搜索算法识别标签,能够有效降低碰撞发生概率,提高标签识别效率.该算法可应用到数量庞大的标签识别系统中,对这类系统具有一定优势.理论分析与实验结果表明:该算法能够有效减少算法时隙数,提
不平衡数据常出现在各应用领域中,传统分类器往往关注于多数类样本而导致样本分类效果不理想.针对此问题,提出一种基于聚类欠采样的集成分类算法(ClusterUndersampling-AdaCost,CU-AdaCost).该算法通过计算样本间维度加权后的欧氏距离得出各簇的样本中心位置,根据簇心邻域范围选择出信息特征较强的多数类样本,形成新的训练集;并将训练集放在引入代价敏感调整函数的集成算法中,使得模型更加关注于少数类别.通过对6组UCI数据集进行对比实验,结果表明,该算法在欠采样过程中抽取的样本具有较强的
以轨迹大数据为基础,结合城市交通状态与用户个性化需求,提出一种基于改进Viterbi算法的动态最优路径规划算法.首先融合交通状态和真实路网拓扑结构,构建基于有向多重加权复杂网络的交通网络模型.采用基于层次分析法和熵权法相结合的综合赋权法对交通网络模型的多权重属性进行权重分配,得到新的有向加权复杂网络模型.进一步采用改进的Viterbi算法求解最优路径.最后,以兰州市为例,对最优路径规划进行分析,并将该算法与静态规划方法进行比较,验证城市最优路径规划算法的有效性与实时性.实验结果表明,结合城市交通状态与用户