论文部分内容阅读
本文使用自组织神经网络(Self-OrganizingNeuralNetwork,SONN)设计了一种自动的中文地址切分算法,并给出了初步试验结果。SONN由输入层和输出层两层组成,两层之间由随机初始权值全连接。每条输入地址的所有字符同时激活输入层上相对应的神经元,神经网络对所有输入地址模式进行学习,学习过程由海伯学习规则(Hebbianlearningrule)和“多赢者通吃(κwinnerstakeall,KWTA)”竞争函数控制。神经网络的自组织学习过程结束后,每条未切分地址被多个(κ)竞争胜出的神经元表达,每个胜出神经元表示地址的一个子模式。算法的目标是使这些子模式与地址里面的词对应起来,从而实现切词。文中通过两个实例测试了算法的原型系统,结果表明当前设计的算法只能有条件的实现正确切词,即输入数据集在完备的情况下才能使输出神经元形成对输入地址的分布式表达,否则,神经元只能学习到数据集中的一些高频字符(汉字、字母或者数字)。最后讨论了SONN算法面向实际应用的局限性以及改善模型的一些思路。