基于自组织神经网络的中文地址切分研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:quintentwc93
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文使用自组织神经网络(Self-OrganizingNeuralNetwork,SONN)设计了一种自动的中文地址切分算法,并给出了初步试验结果。SONN由输入层和输出层两层组成,两层之间由随机初始权值全连接。每条输入地址的所有字符同时激活输入层上相对应的神经元,神经网络对所有输入地址模式进行学习,学习过程由海伯学习规则(Hebbianlearningrule)和“多赢者通吃(κwinnerstakeall,KWTA)”竞争函数控制。神经网络的自组织学习过程结束后,每条未切分地址被多个(κ)竞争胜出的神经元表达,每个胜出神经元表示地址的一个子模式。算法的目标是使这些子模式与地址里面的词对应起来,从而实现切词。文中通过两个实例测试了算法的原型系统,结果表明当前设计的算法只能有条件的实现正确切词,即输入数据集在完备的情况下才能使输出神经元形成对输入地址的分布式表达,否则,神经元只能学习到数据集中的一些高频字符(汉字、字母或者数字)。最后讨论了SONN算法面向实际应用的局限性以及改善模型的一些思路。
其他文献
位于内蒙古赤峰市克什克腾旗的塞罕坝是一个让人着迷的地方。2007年,当我第一次踏上这片土地,便深深喜欢上她,此后,我每年都要携着沉重的相机来为她造像。塞罕坝有着迷人的风
地球大气层中的水汽在全球气候系统、天气动力系统、大气环境科学、水文学以及空间大地测量等方面占有非常重要的地位。近年来,随着全球导航卫星系统GNSS(GlobalNavigationSat
  催化是能源和化工过程的重要的过程,然而由于催化剂结构和中间反应过程及其复杂,长期以来被认为是“黑箱”.通过理性设计找到新的环保低碳的催化过程,合成高效廉价的催化剂
会议
  高能量密度材料的研究由于其重大的研究意义和广泛的实际应用价值受到越来越广泛的关注.在众多含能材料家族中,聚合氮因其生成物为清洁无污染的氮,作为一种环境友好型的
会议
  在材料设计和制备中引入计算设计,加速材料创新水平,已经成为全球化的趋势。近年来,我们以实验中出现的实际问题为出发的,采用第一性原理计算的方法,在高性能存储材料的
会议
空间测量系统在日常的生产生活扮演着越来越重要角色。这些测量系统主要有工业测量系统、全站仪、数字工业摄影测量系统、激光追踪系统、激光扫描系统等。随着社会的发展,大型
目前,由于国民经济的高速发展,交通问题的日益严峻,城市地下工程迅速发展。设计中不可能对工程做出完美无缺的估计,地铁施工中还可能受到许多不利因素的影响,因此地铁施工的安全监
  高性能计算应用软件是人类的财富,因此如何在超级计算机上最大限度的释放它们的计算潜力是人们关注的焦点。只有高性能和高效率才能释放和体现超级计算机的价值。结合多年
会议
  目前锂离子电池面临两大问题:一是安全性问题,二是能量密度低。发展全固态锂电池是我国的战略选择。寻找综合性能优异的锂离子固体电解质材料一直是全固态锂电池的研究重点
会议
北京地址:北京市朝阳区酒仙桥路798艺术区陶瓷二街长春地址:吉林省长春市解放大路338号二十一世纪国际商务总部B座14层香港联络处:香港九龙红磡德丰街22号海滨广场二座12楼12