【摘 要】
:
针对现有粗糙集属性约简方法中存在的连续数据处理时的信息丢失、粒化策略引入不一致信息、参数寻优困难等问题,提出一种适用于连续型数据、基于类别可区分度的非单调性启发式属性约简算法。首先以各样本的标签为依据对论域进行划分,同一标签的样本组合成一个簇,定义每个簇的类间可区分度和类内可区分度;其次,以最大化类间可区分度、最小化类内可区分度为约简原则,定义了一种新的属性重要性判别准则以确定最优约简集,从而提高
论文部分内容阅读
针对现有粗糙集属性约简方法中存在的连续数据处理时的信息丢失、粒化策略引入不一致信息、参数寻优困难等问题,提出一种适用于连续型数据、基于类别可区分度的非单调性启发式属性约简算法。首先以各样本的标签为依据对论域进行划分,同一标签的样本组合成一个簇,定义每个簇的类间可区分度和类内可区分度;其次,以最大化类间可区分度、最小化类内可区分度为约简原则,定义了一种新的属性重要性判别准则以确定最优约简集,从而提高后续分类器的分类性能。在11个UCI数据集上与其他6种属性约简算法进行对比实验,结果表明:与6种算法相比
其他文献
针对高维特征缺失数据在聚类过程中面临的数据高维引发的维度灾难问题和数据特征缺失导致的样本间有效距离计算失效问题,提出一种面向高维特征缺失数据的K最近邻(KNN)插补子空间聚类算法。首先,利用高维特征缺失数据的子空间下的近邻关系对原始空间下的缺失数据进行KNN插补;然后,多次迭代矩阵分解和KNN插补获得数据的最终可靠的子空间结构;最后,利用获得的子空间结构进行聚类分析。通过在6个高维数据集上对不同算
当前性能最优的机器翻译模型之一Transformer基于标准的端到端结构,仅依赖于平行句对,默认模型能够自动学习语料中的知识。这种建模方式缺乏显式的引导,不能有效挖掘深层语言知识,特别是在语料规模和质量受限的低资源环境下,从而造成译文质量的下降。为了缓解上述问题,提出了基于源语言句法增强解码的神经机器翻译模型,显式地引入源语句句法信息指导解码。首先,模型利用源语句句法信息构造句法感知的遮挡机制;然
作为金融市场关键组成部分,股票市场波动研究对合理化控制金融市场风险、提高超额投资收益提供了重要支持,一直以来都是学术界和业界的关注焦点。然而,股票市场受各种因素影响,面对股票市场中多源化、异构化信息,如何高效挖掘、融合股票市场多源异构数据是面临的重要挑战。为能够充分解释不同信息及信息间相互作用对于股票市场价格波动的影响,提出一种基于多重注意力机制的图神经网络预测股票市场价格波动。首先,引入关系维度
网约车成为了人们日常出行的重要方式。在网约车平台中,匹配是一个核心功能,平台需要尽可能增加匹配订单的数量。网约车的需求分布通常是极度不均匀的,订单的起点或终点在某些时间段会呈现出高度集中的特征。因此,提出一种带预警的激励机制鼓励司机跨区域接单,达到平台跨区域运力再平衡的目的。通过对订单信息进行分析处理,建立邻近区域运力预警机制。在区域运力紧张时,激励邻近司机接受跨区域订单,减少运力紧张时期区域内的
针对目前网络谣言鉴别研究,文本学习往往会受到文本读入内容过长导致长距离信息丢失或者是为了捕捉局部信息而依赖于长期输入表示从而影响鉴别结果。通过提出S-LSTM(Sentence-stateLongShort TermMemory networks)算法在保留字词节点信息的同时对句子进行聚合,从而保留句子的局部和全局信息,进而提升网络谣言鉴别的精确性和有效性。与TextGCN、Bi-GCN、Att_
为了提高云制造环境下制造服务组合优化的效率,提出了一种基于改进北极熊算法的制造云服务组合优化方法。该方法对制造服务进行实数编码,并以服务功能和服务质量为评价指标,使用改进的北极熊算法对制造云服务组合优化问题进行求解,得到最优的服务组合方案。同时通过引入动态视野,对算法的局部搜索进行调整,并与遗传算法中的变异策略相结合,以提高求解多目标问题的效率,同时降低因初始参数影响而导致算法陷入局部最优的可能。
联邦学习是一种新型的分布式机器学习方法,可以使得各客户端在不分享隐私数据的前提下共同建立共享模型。然而现有联邦学习框架仅适用于有监督学习,即默认所有客户端数据均带有标签。由于现实中标记数据难以获取,联邦学习模型训练的前提假设通常很难成立。为解决此问题,对原有联邦学习进行扩展,提出一种基于自编码神经网络的半监督联邦学习模型ANN-SSFL,该模型允许无标记的客户端参与联邦学习。无标记数据利用自编码神
个性化的头相关传输函数(Head-Related Transfer Function,HRTF)可以有效改善空间音频质量。针对个性化HRTF难以精确获得问题,提出了一种基于层级集成的个性化空间音频生成方法。该方法通过三个模型逐层建立个性化HRTF中的定位信息。首先,采用高斯混合模型建立用户无关的共用模型。然后,采用自编码器获得与用户有关的HRTF的隐表示,利用深度神经网络在人体生理参数与HRTF的
面对数据稀少、数据维度高、多视角聚类任务的情况下,传统极大熵聚类算法会因类中心趋于一致,从而导致聚类失败。为解决此类问题,在传统极大熵聚类算法的基础上,引入类中心惩罚机制,融合权重矩阵实现多视角划分融合,构建出类中心极大的多视角极大熵聚类算法。该算法通过调整每个视角上的权重来体现某个视角的重要性,并通过类中心极大惩罚项,解决了多视角聚类任务下,因数据稀少、数据维度高导致每个视角上的类中心趋于一致的
随着数字社会的到来,使得数据成为了重要的生产要素,为了充分释放数据要素价值,作为数据安全共享的访问控制技术是实现数据安全应用与治理的关键。因此,围绕分布式架构下密文及密钥的安全性问题提出了一种基于区块链的密文访问控制方案。该方案利用密文生成算法与验证合约实现外包密文存储的真实性与完整性验证;设计了基于安全多方计算的属性密码,实现了用户私钥的链下安全多方计算并确保了私钥的唯一性,极大缓解了单属性权威