论文部分内容阅读
上个世纪90年代,Dietterich等人在研究分子活性预测问题时,最先提出了多示例学习模型。多示例学习被认为是高信噪比、高歧义性的一种学习模型,广泛地存在于现实世界中。多示例学习具有独特的性质,被认为是一种新的学习框架,是与监督学习、非监督学习和强化学习并列的第四种学习框架。本文首先介绍了多示例学习模型产生的背景,相关的理论研究及算法设计的成果,分析了现有算法的不足。然后基于规格化径向基函数网络,提出了一个新的多示例学习算法NRBF-MI。该算法针对多示例学习的特点,提出了包紧密邻域的概念,并在此基础上构造了一种新的网络结构训练方法BCTR;其中定义的网络核函数适合在多示例学习框架下度量包之间的距离。目前多数关于多示例学习模型的研究认为,该学习模型与监督学习更相近,因此大多数算法是通过改进监督学习算法得到的。作为一个有益的尝试,本文利用Agglomerative聚类算法,提出了一个新的多示例预测结构发现方法,并命名为AGG-MI,从而把非监督学习算法应用于解决多示例问题。本文通过在基准数据集上进行的实验,验证了关于NRBF-MI网络的和半径与其性能的关系的分析,证明了NRBF-MI是一个预测精度高,结构简单,而且分类效率高的多示例学习算法。实验还表明AGG-MI算法可以有效地发现多示例预测结构。