高阶神经网络的梯度训练算法收敛性分析

来源 :大连理工大学 | 被引量 : 13次 | 上传用户:liutingkaoyanhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的神经网络是由多层的求和单元构成的,例如多层感知器等.这些网络不但是学者们研究的热点并且已经在各个领域得到了广泛应用.由于求和单元自身的非线性映射能力有限,因此在解决复杂的问题时,单纯由求和单元构成的网络可能无法达到要求的精度.例如,尽管有结论指出,有求和单元构成的单隐层前馈网络可以以任意的精度逼近任意函数.但是在逼近某个复杂的函数时,网络的隐层中需要补充大量的求和单元.这不但增大了网络的成本,而且还降低了网络的泛化能力.为了克服这个缺点,人们引入了某些具有更强的非线性性质的单元,例如:Sigma-Pi单元,积单元和Pi-Sigma单元等.这些单元可以通称为高阶单元.在结构中整合了高阶单元的神经网络被称为高阶神经网络(HONN),其中包括Sigma-Pi神经网络(SPNN),Pi-Sigma神经网络(PSNN)以及积单元神经网络(Product-Unit neural network-PUNN)等.人们已经对各类高阶神经网络的性能以及应用做了相应的研究,但是由于高阶神经网络的结构复杂,因此对其理论上的研究相对较少.梯度算法是目前最流行的前馈神经网络训练算法.梯度法有两种不同的执行方式,它们是在线执行方式和批处理执行方式.本文主要的工作是分析用梯度法训练高阶神经网络的收敛性.我给出了Sigma-Pi神经网络和积单元神经网络的梯度法收敛性结果.此外,我还研究了用高阶神经网络来实现任意的布尔函数,并给出了有效地解决方案.本文的结构及内容如下:第一章回顾有关神经网络的一些背景知识.在第二章中,通过对Σ-Π-Σ这类Sigma-Pi神经网络的分析,得到了一些与网络结构无关的梯度算法收敛性结论.该结论具有很好的扩展性,可以涵盖其他几类Sigma-Pi神经网络的收敛性,其中包括Σ-Σ-Π和Σ-Π-Σ-Π.并且此结论也适用于单隐层的求和神经网络,即Σ-Σ.在论述的过程了,对于训练过程中的误差函数的单调性也给出了相应的证明.第三章和第四章分别对用批处理梯度算法和在线梯度算法训练积单元神经网络时误差函数的单调性及收敛性进行了分析.该结论为由全局搜索算法和局部优化算法(梯度法)构成的组合算法的局部优化行为提供了理论支持.随后的数值试验也验证了理论结果的正确性.第五章提出了二进积单元神经网络(Binary Product-Unit neural network-BPUNN),并证明了这种网络可以模拟逻辑数学中的主析取范式,可以实现任意的布尔函数.网络的权值是通过直接计算得到的,而且都是二值的.随后还给出了该网络的规则读取算法,可以令我们从已得的网络中直接得到真值样本的数学表达式.第六章提出了带有输入转换的二进Pi-Sigma神经网络(BPSNN),并证明了这种网络可以实现任意的布尔函数.该网络在计算布尔函数时,对应着主合取范式.网络权值都是{-1,1}这样二值的,而且网络的训练不需要多步迭代的过程,权值是直接求解得到的.随后还给出了此网络的规则读取算法.
其他文献
我国国内生产总值稳步增长,财政性教育经费支出也在逐年递增,要从源头做好预算工作,必须抓好预算编制。高校支出预算作为高校预算编制的重点和难点,要求编制模式从粗放型向精
金融自由化是实现金融深化的一种手段,传统的金融自由化理论既有其合理的一面,也存在一定的局限性。转轨中国家金融自由化的实践大多并不成功,对金触自由化理解错误、忽略金融自
作者、成书时代与书的基本内容汜胜之是山东省曹县人,我国古代杰出的农学家。他在西汉成帝(公元前32——公元7年)时为议郎,在陕西关中平原地区教导农业,获得丰收,后来升为御
目的分析比较腹腔镜与Dixon直肠癌根治术的临床疗效。方法回顾性分析腹腔镜直肠癌根治术53例和Dixon直肠癌根治术69例患者,比较2组患者的手术时间、术中出血量和术后肛门排气
为缓解政治人才危机,汉武帝继位后在选官用人制度上进行了重大改革:兴办太学、地方官学培养人才;完善察举推荐人才;实行考试选拔人才;突破传统。重用专业人才。这些改革使西汉完成
期刊
在常温常压下,空气中泄漏的氢气浓度达到4%-74.5%时变得易燃易爆,所以安全、可靠且廉价的氢气测量传感技术是安全利用氢气的必要保障。迄今为止,基于不同工作原理的氢气传感
身为高中英语教师,面对高考,努力提高英语课堂教学效果是每一位教师奋斗的目标。可是,高中生英语课堂学习现实又是怎样呢?学生学习分化严重,基础差距较大,教师教学难于顾全全班,这就
【正】 最近,美国审计总署修改了政府审计准则。因为该准则的封面为黄色,所以人们通常称此为“黄皮书”。本准则包括对政府的机构、计划执行、活动和职能进行审计的准则,以及
切换时滞系统是一类重要的混杂系统,具有广泛的实际应用背景。由于连续时间(离散时间)动态、离散事件动态,以及时滞同时存在并相互作用,使系统的动态行为变得十分复杂。系统