基于双向选择的伪近邻算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:yangzhouzhoudaojun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对伪近邻分类算法(LMPNN)对异常点和噪声点仍然敏感的问题,提出了一种基于双向选择的伪近邻算法(BS-PNN)。利用邻近性度量选取k个最近邻,让测试样本和近邻样本通过互近邻定义进行双向选择;通过计算每类中互近邻的个数及其局部均值的加权距离,从而得到测试样本到伪近邻的欧氏距离;利用改进的类可信度作为投票度量方式,对测试样本进行分类。BS-PNN算法在处理复杂的分类任务时,具有能够准确识别噪声点,降低近邻个数k的敏感性,提高分类精度等优势。在UCI和KEEL的15个实际数据集上进行仿真实验,并与KNN、W
其他文献
视觉多目标跟踪是计算机视觉领域的热点问题,然而,场景中目标数量的不确定、目标之间的相互遮挡、目标特征区分度不高等多种难题导致了视觉多目标跟踪现实应用进展缓慢。近年来,随着视觉智能处理研究的不断深入,涌现出多种多样的深度学习类视觉多目标跟踪算法。在分析了视觉多目标跟踪面临的挑战和难点基础上,将算法分为基于检测跟踪(Detection-Based-Tracking,DBT)、联合检测跟踪(Joint-
水下图像是海洋信息的重要载体,由于水下环境十分复杂,原始水下图像常常具有大量噪声,对后续的检测任务造成影响,因此水下图像预处理成为当前研究的热点。为了深入分析国内外学者对深度学习驱动的水下图像预处理研究进展,对近年来国内外相关文献进行总结分析。介绍了两类传统水下图像预处理方法,并分析其优缺点;根据是否结合物理模型,分析了深度学习驱动的水下图像预处理方法,并将相关方法进行对比总结;分析了深度学习方法
数据挖掘与机器学习技术日益趋向成熟并且被广泛应用于实际问题的处理中,但该领域仍面临着诸多挑战,如不平衡数据集分类问题。利用过采样技术处理这类问题时,通常只考虑数量的不平衡,而不考虑数据分布是否平衡。利用信息熵度量数据集的局部密度信息,从分布上考虑数据集的不平衡程度,并提出了基于熵的危险集的概念和它的三种使用策略,即基于熵的危险集过采样算法、基于熵的安全集过采样算法和基于熵的自适应过采样算法。竞争性的实验结果表明,这些算法可以有效提升经典过采样算法的性能,为进一步利用信息熵理论研究不平衡数据集提供了成功的实
综述了基于机器学习的遥感图像超分辨重建技术的研究和发展。基于机器学习的遥感图像超分辨率重建技术通过学习低分辨图像与高分辨图像之间映射的关系,提升遥感图像的空间分辨率,从而有助于遥感图像的视觉分析。根据数据表达方法的不同将基于机器学习的遥感图像超分辨方法分为两类,包括基于字典学习的方法和基于深度学习的方法;简述了各类方法针对的问题,分析其设计思路和实现原理;对各类方法的优缺点和性能指标进行了对比分析
伴随自然语言处理快速发展,自动问答系统(Question&Answer,QA)受到研究者的广泛关注。基于表格的自动问答(Table QA)实质是在给定自然语言形式的问题文本条件下,利用表格知识库信息进行查询推理得到答案的过程。从语义解析方法角度分析了基于表格知识库的问答模型、算法特点及其相关问题,同时结合人工智能技术的发展,重点探讨了表格自动问答技术的难点以及未来可能的挑战。
基于骨骼的动作识别因不受人体物理特征的影响,简单清晰地传达了人体行为识别的重要信息而受到广泛关注。传统的应用程序骨架建模通常依赖遍历规则的人为设置而导致表达能力有限和推广困难。因此,在近年来热门的时空图卷积网络(ST-GCN)模型基础上提出了一种新的划分骨架关节点的分区策略。该策略相比于原始分区方法加强了身体相对位置之间的关系,从而有利于提高骨架关节点信息在时间和空间上的关联。与此同时,在训练过程
针对高速公路场景下的车辆目标检测问题,提出了一种改进的YOLOv4网络对交通场景下车辆目标进行检测的方法;制作了一个多天候、多时段、多场景的车辆目标数据集,并依据数据集得到检测模型;提出多标签检测方法,并在多标签之间建立约束关系,得到更完善的车辆信息;提出了一个图像拼接检测方法,将多幅图像通过拼接层连接后进行车辆检测,以此提升网络的运行效率。实验结果表明,多样化数据集提高了车辆检测精度,减少了车辆
动态非平衡数据分类是在线学习和类不平衡学习领域重要的研究问题,用于处理类分布非常倾斜的数据流。这类问题在实际场景中普遍存在,如实时控制监控系统的故障诊断和计算机网络中的入侵检测等。由于动态数据流中存在概念漂移现象和不平衡问题,因此数据流分类算法既要处理概念漂移,又要解决类不平衡问题。针对以上问题,提出了在检测概念漂移的同时对非平衡数据进行处理的一种方法。该方法采用Kappa系数检测概念漂移,进而检测平衡率,利用非平衡数据分类方法更新分类器。实验结果表明,在不同的评价指标上,该算法对非平衡数据流具有较好的分
针对P2P(Peer to Peer)借贷项目违约风险预测中财务信息不完全或质量较低、预测准确率不高等问题,提出了一种考虑平台社会网络关系的P2P借贷项目违约风险预测的方法。通过对P2P借贷平台社会网络相关信息进行分析,从社会资本的结构维度、关系维度和认知维度发掘其中具有风险预测价值的关键特征,即社会网络风险特征,并将这些特征作为预测指标用于违约风险预测,依据多种非线性预测方法分别构建基于传统财务指标预测模型和引入社会网络风险特征后的混合指标预测模型,并对模型的预测结果进行了对比分析。实验结果表明,P2P
顾客作为产品满意度测度过程中评价决策的主体,对其进行分类研究,识别不同顾客群体异质评价特征具有重要意义。顾客评价特征存在多元性和冲突性,根本原因是顾客作为决策者的异质性,而顾客的异质性来源于顾客本身属性,包含分类型属性和数值型属性。提出了一种基于惩罚竞争机制的混合属性顾客分类方法,根据数值型和分类型属性值的分布规律,给出了混合数据初始聚类中心的确定方法;建立了统一相似性度量模型,并引入惩罚竞争机制,实现了聚类过程中的基本迭代和自动优化聚类数。以某产品异质顾客分类问题为例验证了所提方法的可行性,继而通过"