论文部分内容阅读
多实例学习(MIL)作为一种半监督学习形式,其中训练数据标签上只有不完整的知识。具体而言,标签被分配在这些包上,包中实例的标签未知。在MIL算法中,如果包中至少有一个实例为正,则包被标记为正;如果包中的所有实例均为负,则包标记为负。MIL算法的目标是通过学习一个分类函数,预测测试数据中包或实例的标签。同时,MIL的性质使其可应用于多种应用,从药品活动预测到文本或多媒体信息检索。对多样化密度算法的缺陷进行了改进,提出了一种新颖的多实例学习算法。最后,在图像分类/检索问题数据集-Corel数据库上,将提