不平衡数据学习算法在相似性学习中的应用

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:ya0000000000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实问题中,相似性学习的样本对存在不平衡现象,即相似性样本对的数量会远小于不相似性样本对的数量.针对此问题,文中提出两种样本对构造方法——不相似K近邻-相似K近邻(DKNN—SKNN)和不相似K近邻-相似K远邻(DKNN—SKFN).运用这两种方法可有针对性地选择相似性学习样本对,不仅可加快支持向量机的训练过程,而且在一定程度上解决样本对之间的不平衡问题.在多个数据集上进行文中方法和经典的重采样方法的对比实验,结果表明DKNN—SKNN和DKNN—SKFN具有良好性能.
其他文献
融通仓作为第三方物流企业的创新业务,在为解决银行与企业间、特别是中小企业融资难问题中可发挥积极作用,同时也为第三方物流企业自身带来更多的好处.只要解决好其运作中的
资本市场的资金短缺和货币市场的资金饱和困扰着中国金融市场,建立市场连通机制能促进我国货币市场与资本市场的协调发展.市场连通机制主要由组织机构、资金渠道、金融工具、
为减少人工免疫识别系统(AIRS)的记忆细胞数量并提高AIRS的分类准确率,提出一种基于记忆细胞剪切和非线性资源分配的人工免疫识别系统(PNAIRS).PNAIRS采用样本属性离散化来压缩训练
新世纪教育实验展望中央教育科学研究所丰力即将到来的21世纪,激励着人们对教育作跨世纪的思考,这种思考集中在对未来人才素质的培养上。目前,已制订出一大批面向新世纪人才素质培
最大流问题在许多领域有广泛的应用,然而随着网络规模的增加,传统的算法无法快速高效地求解最大流问题.对一个给定的有向网络,文中提出一种收缩邻居节点集的方法(CNA)求解其最大流.
【正】 世界上所有美好的事物都是创造力的果实。米尔永葆教学的青春一门课,三五年讲下来,如果只是简单重复,将第一次讲过的内容一次又一次地反复讲,不用多久,就会产生一种厌
我院自2002年1月份起,应用改良筋膜内子宫切除术,观察60例,认为效果良好,报告如下:
知识管理不仅是政府、企业成功运营的重要手段,同时也是非政府组织持续发展的动力所在。非政府组织知识管理是以知识资源为基础、以知识工作者为核心、以知识创新为目标的管理
斯密的价值理论具有五个重要的方法论特点和理论特色:价值理论体系上的抽象-演绎分析法、抽象分析法、意义重大的稀缺价值论、独具特色的自然秩序论和承前启后的价值理论;研
针对基于信息熵求核算法效率不理想的情况,给出信息观下的二进制差别矩阵定义,理论上证明基于信息熵的核属性与基于二进制差别矩阵的核属性等价;并将决策表划分为相容的对象集和