类中心极大的多视角极大熵聚类算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:wangkaidi58
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对数据稀少、数据维度高、多视角聚类任务的情况下,传统极大熵聚类算法会因类中心趋于一致,从而导致聚类失败。为解决此类问题,在传统极大熵聚类算法的基础上,引入类中心惩罚机制,融合权重矩阵实现多视角划分融合,构建出类中心极大的多视角极大熵聚类算法。该算法通过调整每个视角上的权重来体现某个视角的重要性,并通过类中心极大惩罚项,解决了多视角聚类任务下,因数据稀少、数据维度高导致每个视角上的类中心趋于一致的问题。通过大量实验进一步证明,该算法在处理高维度、数据稀少、存在干扰数据和多视角的数据集时,其聚类效果明
其他文献
岩体质量分级是进行工程设计和施工的基础。通过搜集不同地区55组实测样本和17组插值样本建立案例库,考虑岩体的复杂不确定性以及异地岩体的差异性,在案例库基础上提出一种改进两阶段回归迁移学习(Two-stage TrAdaBoost.R2)-孤立森林(Isolated Forest)多因素岩体质量等级预测模型。将广州抽水蓄能电站第1期地下工程的12个样本用于模型测试,研究结果表明:(1)迁移学习可以通
期刊
针对由于驾驶员对于道路限速和时延信息获取的不确定性而引起的跟驰行为受扰和交通流失稳等问题,提出了一种车联网环境下考虑时延速度差和限速信息的跟驰模型(TD-VDVL)。首先,引入时延导致的速度变化量和道路限速信息对FVD(Full Velocity Difference)模型进行改进;然后利用线性谱波微扰法推导出TD-VDVL模型的交通流稳定性判断依据,分别分析模型中各参数对系统稳定性的影响;最后利
期刊
针对高维特征缺失数据在聚类过程中面临的数据高维引发的维度灾难问题和数据特征缺失导致的样本间有效距离计算失效问题,提出一种面向高维特征缺失数据的K最近邻(KNN)插补子空间聚类算法。首先,利用高维特征缺失数据的子空间下的近邻关系对原始空间下的缺失数据进行KNN插补;然后,多次迭代矩阵分解和KNN插补获得数据的最终可靠的子空间结构;最后,利用获得的子空间结构进行聚类分析。通过在6个高维数据集上对不同算
期刊
当前性能最优的机器翻译模型之一Transformer基于标准的端到端结构,仅依赖于平行句对,默认模型能够自动学习语料中的知识。这种建模方式缺乏显式的引导,不能有效挖掘深层语言知识,特别是在语料规模和质量受限的低资源环境下,从而造成译文质量的下降。为了缓解上述问题,提出了基于源语言句法增强解码的神经机器翻译模型,显式地引入源语句句法信息指导解码。首先,模型利用源语句句法信息构造句法感知的遮挡机制;然
期刊
作为金融市场关键组成部分,股票市场波动研究对合理化控制金融市场风险、提高超额投资收益提供了重要支持,一直以来都是学术界和业界的关注焦点。然而,股票市场受各种因素影响,面对股票市场中多源化、异构化信息,如何高效挖掘、融合股票市场多源异构数据是面临的重要挑战。为能够充分解释不同信息及信息间相互作用对于股票市场价格波动的影响,提出一种基于多重注意力机制的图神经网络预测股票市场价格波动。首先,引入关系维度
期刊
网约车成为了人们日常出行的重要方式。在网约车平台中,匹配是一个核心功能,平台需要尽可能增加匹配订单的数量。网约车的需求分布通常是极度不均匀的,订单的起点或终点在某些时间段会呈现出高度集中的特征。因此,提出一种带预警的激励机制鼓励司机跨区域接单,达到平台跨区域运力再平衡的目的。通过对订单信息进行分析处理,建立邻近区域运力预警机制。在区域运力紧张时,激励邻近司机接受跨区域订单,减少运力紧张时期区域内的
期刊
针对目前网络谣言鉴别研究,文本学习往往会受到文本读入内容过长导致长距离信息丢失或者是为了捕捉局部信息而依赖于长期输入表示从而影响鉴别结果。通过提出S-LSTM(Sentence-stateLongShort TermMemory networks)算法在保留字词节点信息的同时对句子进行聚合,从而保留句子的局部和全局信息,进而提升网络谣言鉴别的精确性和有效性。与TextGCN、Bi-GCN、Att_
期刊
为了提高云制造环境下制造服务组合优化的效率,提出了一种基于改进北极熊算法的制造云服务组合优化方法。该方法对制造服务进行实数编码,并以服务功能和服务质量为评价指标,使用改进的北极熊算法对制造云服务组合优化问题进行求解,得到最优的服务组合方案。同时通过引入动态视野,对算法的局部搜索进行调整,并与遗传算法中的变异策略相结合,以提高求解多目标问题的效率,同时降低因初始参数影响而导致算法陷入局部最优的可能。
期刊
联邦学习是一种新型的分布式机器学习方法,可以使得各客户端在不分享隐私数据的前提下共同建立共享模型。然而现有联邦学习框架仅适用于有监督学习,即默认所有客户端数据均带有标签。由于现实中标记数据难以获取,联邦学习模型训练的前提假设通常很难成立。为解决此问题,对原有联邦学习进行扩展,提出一种基于自编码神经网络的半监督联邦学习模型ANN-SSFL,该模型允许无标记的客户端参与联邦学习。无标记数据利用自编码神
期刊
个性化的头相关传输函数(Head-Related Transfer Function,HRTF)可以有效改善空间音频质量。针对个性化HRTF难以精确获得问题,提出了一种基于层级集成的个性化空间音频生成方法。该方法通过三个模型逐层建立个性化HRTF中的定位信息。首先,采用高斯混合模型建立用户无关的共用模型。然后,采用自编码器获得与用户有关的HRTF的隐表示,利用深度神经网络在人体生理参数与HRTF的
期刊