基于直接强化学习的面向目标的仿生导航模型

来源 :中国科学:信息科学 | 被引量 : 0次 | 上传用户：summercoming1

【摘要】

：

针对连续动作和状态空间中面向目标的导航问题,依据海马结构中位置细胞相关特性和相关信息传递通路,构建海马位置细胞到前额叶皮层假设的动作细胞的脉冲神经网络模型.连续的

【作者】

：

于乃功李倜方略

【机构】

：

北京工业大学电子信息与控制工程学院,计算智能与智能系统北京市重点实验室,

【出处】

：

中国科学:信息科学

【发表日期】

：

2016年03期

【关键词】

：

模型状态空间直接强化学习位置细胞动作细胞仿真实验脉冲响应脉冲神经网络前额叶皮层智能体

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对连续动作和状态空间中面向目标的导航问题,依据海马结构中位置细胞相关特性和相关信息传递通路,构建海马位置细胞到前额叶皮层假设的动作细胞的脉冲神经网络模型.连续的状态空间和动作空间分别由位置细胞和动作细胞进行表征,模型采用直接强化学习与脉冲响应模型相结合的算法进行面向目标的自主导航.在Morris水迷宫环境中的仿真实验结果表明,该模型能够解决连续状态空间中面向目标导航问题,所采用算法在性能上优于传统的时间差分学习算法.调整网络中动作细胞的数量,模型的收敛性能不变,在改变状态空间和目标位置时,也可以实现面向目标的导航. In order to solve the problem of target-oriented navigation in continuous motion and state space, a pulse neural network model of action cells in hippocampal position to the prefrontal cortical hypothesis is constructed according to the location of cells in the hippocampal formation and related information transmission paths.The continuous state space and The action space is characterized by the position cells and the action cells, respectively, and the model uses the algorithm of direct reinforcement learning and impulse response model for autonomous navigation.According to the simulation results in the Morris water maze environment, this model can solve the continuous state In the space-oriented navigation system, the proposed algorithm outperforms the traditional time-difference learning algorithm in performance.Adjusting the number of action cells in the network, the convergence performance of the model remains unchanged, and when the state space and the target location are changed, Target navigation.

其他文献

茶花女形象与模仿艺术——法国19世纪末《茶花女》与中国清末《新茶花》的对比研究

本文以法国十九世纪著名作家小仲马的名作《茶花女》为研究主题，并分析其与中国相关领域作品的联系和影响。以中国清末作家钟心清的《新茶花》为切入点，两者的契合点建立在模仿

学位

人物形象模仿艺术《茶花女》《新茶花》清朝末期

辽北地区水稻产量及氮素利用率对氮素调控的响应

以辽北地区水稻品种铁粳9号为试材,分析了水稻产量及氮素利用率对氮素调控的响应。结果表明:同一基蘖穗肥比例下,随施氮量增加,有效穗数增加,千粒重降低,总吸氮量提高,氮素生

期刊

辽北收获指数吸氮量氮素利用率有效穗数氮素调控千粒重后移铁粳茎蘖数

用散射矩阵法求二维光子晶体缺陷内的场分布

本文介绍了一种新颖而高效的计算位于二维光子晶体缺陷中电磁场模式的方法。这一方法是通过将光子晶体中每个柱体的散射场叠加起来而得到所求场的。用该方法计算了两例具体的

期刊

光子晶体散射矩阵贝塞尔函数汉克尔函数

高科技的变态

我们生活在一个高科技的年代,人们愿意把科技与进步联系在一起,确实太多的前进与科技的发展息息相关,所以人们崇尚它,追求它。但人有时也会不知不觉地走火入魔了,我有时在想

期刊

一种分析掺饵光纤放大器性能的简单方法

掺饵光纤放大器的主要性能是它的饱和增益特性和噪声系数。本文首先用两个经验公式 ,介绍了一种用于模拟掺饵光纤放大器性能的简单方法。接着给出了一个超定方程组 ,对这种方

期刊

掺饵光纤放大器性能分析饱和增益噪声系数

《收藏家》与《法国中尉的女人》的互文分析

对于英国作家约翰·福尔斯的开山之作《收藏家》,某些评论家认为它只是一部恐怖小说,但仔细剖析之后发现事实远非如此。在它犯罪小说的外衣下,约翰·福尔斯深入探讨了艺术的

学位

约翰·福尔斯《收藏家》《法国中尉的女人》共性特性

坚持把“以人为本”的观点贯穿子安全管理始终

自2002年开始,国家每年都开展“全国安全生产月”活动,集中排查和整治安全隐患,大力宣传党和国家安全生产方针、政策、法律法规和加强安全生产的重大举措,推广先进典型和经验

期刊

以人为本观点贯穿安全生产科学发展观关爱生命安全文化建设全社会重视重大举措先进典型生命为本生命价值生产方针和谐社会国家安全法律法规

风中的留言——未来E时代的资讯生活

在这个资讯发达的年代，人们的通信方式愈加的丰富多彩。从最早的固定电话到美国人马丁·库泊发明第一部手机,移动通信开始得到大发展,直至现在手机作为语音通话工具的概念早已

期刊

计算机辅助语言教学软件评估——《大学体验英语综合教程》光盘个案研究

随着计算机技术的迅速发展，诸多的计算机辅助语言教学软件随之面世并运用于英语教学中。越来越多的教师使用CALL(计算机辅助语言教学)和CALL软件进行教学。然而老师和学生们在

学位

大学英语教学计算机辅助语言教学CALL软件体验英语光盘

我的数码日记:声声断断……

我有我的麻木和敏感,以前会用日记写下这些感怀,可是越来越感到语言的多彩已赶不上感触的丰富,好像话一出口就已经言不及意。后来,我发现了数码相机,于是开始了用图像代言的

期刊

基于直接强化学习的面向目标的仿生导航模型

与本文相关的学术论文