基于SVDD的多示例学习方法的研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:wormchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
上世纪90年代,Dietterich等人在药物活性预测问题的研究中提出了多示例学习的概念。在该学习模型中,训练样本的歧义性比较特殊,使得多示例学习模型与传统的机器学习模型有很大的差别。由于多示例学习本身独特的性质和良好的应用前景,被称为是与监督学习、非监督学习和强化学习并列的第四种机器学习框架,并起了国内外研究者的极大关注。经过近几年的研究,多示例学习的应用越来越广泛。在多示例问题中,由于正包中的示例标签类别是不确定的,仅仅知道这个正包中至少包含一个正示例。国内外学者针对多示例学习的独特性质,提出了解决多示例学习问题的一些途径。本文分析了现有算法的不足,然后基于SVDD的模型提出了两种新的算法:MI-NSVDD_B算法和MI-NSVDD_I算法。本文主要研究了以下内容:首先对多示例学习的研究现状进行了综述。然后介绍了SVM和支持向量描述域的概念,并针对NSVDD做了详细的理论推导。然后介绍了两种解决多示例学习问题的支持向量数据描述算法mi-NSVDD算法和MI-NSVDD算法,并且对这两种算法进行了一定的分析,提出了该算法所存在的一些缺陷和不足。其次,本论文针对多示例学习问题的特点,提出了一种消除包中示例歧义性的方法:这个算法先通过概率的方法对正包中所有的示例进行精度预测,然后在每个正包中选出这个包中预测精度最高的示例来代表这个包,从而把包转换成为了一个单独的示例。这些示例组成的集合即为消除歧义后的正示例集合。然后又针对负包提出了一种选择最具有代表性的负示例的算法:把负包中每个示例与选出的消歧义后的正示例集合的距离计算出来,然后选择距离最远的示例作为这个负包中代表性的示例,从而同样也把包转换成了单示例。最后,提出了两种特征映射方法:基于包等级的特征映射和基于示例等级的特征映射。这两个算法可以分别把示例进行映射,然后使用NSVDD算法对进行映射后的单示例问题进行学习和求解,并得到了最终的分类器。针对不同的映射方法提出了两种基于支持向量数据描述的多示例学习算法:MI-NSVDD_B算法和MI-NSVDD_I算法。然后论文在实验部分验证了MI-NSVDD_B算法和MI-NSVDD_I算法的有效性。综上所述,本文所提出的MI-NSVDD_B算法和MI-NSVDD_I是能够有效解决多示例学习问题的新的算法。
其他文献
在当今信息化世界中,中文信息处理技术已经在各个领域中得到了广泛的应用。本文主要对中文分词算法中的基于分词词典机制的最大匹配算法进行研究讨论。由于中文语法语义复杂导
在飞速发展的交流调速系统中,交流变频电机作为主要的拖动方式已逐渐占据主导地位,在生产实践中的应用越来越广泛。而在采用了绝缘栅双极型晶体管(IGBT)器件的脉冲宽度调制(PWM)型变频器后,变频电机却出现了寿命问题,其中变频电机用漆包线耐电晕性能是制约其寿命的一个重要方面,这时就需要特定的测试仪器能够有效检测漆包线耐电晕的性能。在深入研究漆包线耐电晕测试相关技术的基础上,本文采用了IGBT的H桥技术
产品评论挖掘就是从用户发表的评论中挖掘出产品特征、用户观点,并判断观点极性,为生产、营销商家和潜在的用户提供参考。通过对提取出的产品特征进行分析,发现用户对产品特征粒
安全协议分析和验证在信息安全领域占有重要地位。目前,安全协议形式化方法分析和验证主要集中在对实用性较差的安全协议抽象规范分析和验证方面,对注重实用性的安全协议代码分
图像分割是计算机视觉与图像处理领域的重要研究课题,其变分方法可集成多种因素以提高分割的自动化程度,但传统变分模型计算效率较低等缺点制约了该方法的工程应用。本论文针对
人类阅读载体由纸质载体向电子化的方向转化以及电子辅助阅读工具的出现将是人类未来阅读发展方向的必然。现有的大部分研究基本都是外文图像的分析,国内对于图像版面分析和理
为提高 web应用的安全性,笔者所在课题组提出一种应用程序切片技术的web分析模型,对网页代码进行大规模分析,旨在发现安全规则和安全漏洞。本文则主要研究静态程序切片及其在安
单类分类器作为一种概念学习方法,旨在描述目标数据,因而区别于两类分类器,成为分类器设计中的一个新分支,受到众多学者的关注和重视。本文针对目前单类问题的研究成果从密度方法
目前,安全协议的代码实现仍然主要依赖于手工编码,但手工编码低效、易错,容易引入各种漏洞,也不利于安全协议的修订和更新。人们对安全协议的代码自动化实现还未开展广泛和深入的
将不同格式的数学公式转换为某种统一格式以保证搜索与处理数学信息的广泛性与兼容性,是实现数学公式检索的基础。本文首先对数学公式在网络和计算机中的主流表达形式及其转换