论文部分内容阅读
在这篇论文中,我们主要研究基于多分类问题的前馈神经网络关于输出层单元数目的设计。对于类别数目为r(r?3)的输入信息向量集,我们最常用的方法是传统的一对一方法:输出层的节点数目等于输入信息向量集的类别数目。对于属于第i类)(1?i?r的信息输入向量,其输出层的理想输出为:第i个输出节点的值为1,其余所有的输出节点的值为0。在本文中,我们提出了一个新的多分类方法——二进制方法:二进制方法的输出节点的数目比输入信息向量集的类别数目要少。对于类别数目确定的输入信息向量集,其输出层的理想输出可能含有两个甚至更多的值为1的节点。令 qq r221,其中q2,对于r类多分类问题,二进制方法对应于输出层只需要q个输出节点的网络结构,并且这r个类别的理想输出都是以一个二进制数的形式表现出来的。 在本文中,我们首先将三层神经网络结构简化为只含有隐层和输出层的两层网络,因为隐层的输出只与隐单元的数目直接相关,与输入样本信息没有直接关系,而输出层的输出由隐层的输出直接决定。接着,我们将多分类问题转化为欧式空间中多立方体顶点的分类。对于隐单元数目为2和3的情况,理论分析结果比较成熟。在此基础上,我们主要研究隐单元数目为4的情况。本文证明了在一对一方法可分的情况下,二进制方法只需要更少的输出节点就能解决同一多分类问题,而且二进制方法还能解决一些一对一方法解决不了的多分类问题。因此,本文提出的二进制方法是可取的:既降低了网络结构的复杂程度,又可以解决更多的分类问题。