多示例学习的包层次覆盖k近邻算法

来源 :第十三届中国Rough集与软计算学术会议、第七届中国Web智能学术研讨会、第 七届中国粒计算学术研讨会联合学术会议 | 被引量 : 0次 | 上传用户:kangyue_1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  多示例学习是一种新型的机器学习框架,正包中大量的噪声使多示例数据集具有很大的歧义性。为了排除多示例数据集正包中大量的假正例,提高分类精度,本文结合邻域覆盖算法,提出了一个新的多示例包层次覆盖k近邻算法。覆盖算法的学习结果是一系列的球形邻域,在每一个球形邻域中只含有同类样本,本文利用的覆盖算法的这一特性重新组织多示例数据集的包结构。概括的说,为了排除正包中大量的假正例,首先对原有的多示例包结构进行重新构造,使用覆盖算法生成的球形邻域做为新的包结构,从而提高多示例样本在新的特征空间中的可分离性。然后,使用包层次的k近邻算法排除正包中大量的噪声并预测测试包的类别。实验表明,多示例学习的包层次覆盖k近邻算法具有很好的性能。
其他文献
  将多粒度理论融合到支持向量机理论中,提出了一种基于多粒度数据压缩的支持向量机分类算法(MG-SVM)。首先,利用多粒度理论对数据进行粒化与压缩;然后,对压缩后的数据利用
洪昭光:大众心目中的“健康传道士”2002年,没有谁像洪昭光那样得到媒体的宠爱。报纸、杂志、电视、广播、网络、出版社,大家一齐把目光对准洪昭光。轮番热炒的结果,当然是
  针对模糊互补判断矩阵的一致性问题,给出了一种一致性递归迭代调整算法。基于逐阶主子阵给出了一致性调整。指出了出现标度转换的情况,并定义了模糊互补判断矩阵的标度转换
2020年受公共突发卫生事件影响,部分小企业吸纳就业生数量大幅降低,毕业生职业道德教育质量也因此下滑,极大地影响高校毕业生的就业质量和就业率,同时也在某种程度上对高校毕
“阎老师又画了一只虎!”我不信。阎老师日前生病,在北京三零一医院诊治,出院后,专车送他回老家休养。玉涛先生打开画卷,我不由感到震撼:不仅吃惊于画面气势之美妙,更感动于
在惠农利农政策的号召下,农村农业经济发展十分迅速.农村农业经济的发展情况对人民的日常生活有极大的影响.所以,从惠农利农的角度来看,我们也应该及时地发现我国农村农业经
营商环境体现一个地区的经济竞争力,其优劣直接影响企业发展壮大,并将对地区经济社会发展产生重要影响.本文通过分析当前营商环境中存在的问题,对如何优化新时代民营企业营商
  在多粒度时间序列研究中不确定性问题是时间序列数据挖掘研究中的重要课题。时间序列时序粒度本身的不稳定是一种广泛存在现象,也是时间序列数据挖掘困难的一个重要原因之
近些年,我们只要一开电视,随便哪个台,你总能看到“XX肾宝”“X力神”等补肾广告;关上电视,想安静地看看报纸,随手一翻,就能在醒目的位置看到“男人要硬气”“十男九虚”等产
  基因表达谱数据具有高维度、低样本和连续型等特点,建立肿瘤分类模型的关键在于准确找出一组能够决定癌症基因样本类别的特征基因。传统的特征选择方法在处理连续型数据时