鸽子视觉—行为抉择的强化学习研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户：hellobaby54088

【摘要】

：

行为抉择(认知执行)是人类与动物等智体(agent)在自然界优胜劣汰下得以生存而必备的技能,通过对外界信息的判断而指导其行为做出抉择。智体获取外界信息的主要来源是视觉,占

【作者】

：

陶梦妍

【出处】

：

郑州大学

【发表日期】

：

2017年期

【关键词】

：

视觉-行为抉择强化学习动态强化学习模型 NCL 神经元响应特征

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

行为抉择(认知执行)是人类与动物等智体(agent)在自然界优胜劣汰下得以生存而必备的技能,通过对外界信息的判断而指导其行为做出抉择。智体获取外界信息的主要来源是视觉,占据所有感知信息的80%以上。在自然界中,智体赖以生存的视觉-行为抉择大部分是后天学习(强化学习)得来。鸽子因其强大的视觉感知能力和不亚于哺乳动物的行为抉择能力,成为视觉认知领域的典型模式动物。因此开展鸽子视觉-行为抉择的强化学习研究,对于揭示智体在行为抉择中的认知机制具有重要意义,有助于理解智能抉择行为的脑机制,深化对大脑认知抉择工作原理的认识。关于鸽子视觉-行为抉择的研究虽已取得一些进展,但多侧重于静态规则下的强化学习研究,实验范式过于简化,多采用固定不变的学习率或单一的奖励矩阵,并不能真正的模拟智体在动态环境规则下的行为抉择机制。此外,NCL区(nidopallium caudolaterale)神经元在强化学习过程中所起的作用尚不明确。为此本文以鸽子为实验对象,设计了动态强化规则的视觉-行为抉择实验范式,开展行为训练,同步采集了鸽子NCL区神经元电信号,从行为学和神经元响应角度分析了鸽子在动态强化学习过程中的行为抉择特性和NCL区神经元的响应特性。本文主要开展的工作如下:(1)设计了两种动态规则下的视觉-行为抉择训练范式。设计了随机强化和反转强化两种视觉-行为抉择实验范式;根据拟定的实验流程搭建了行为训练的硬件与软件平台,实现了鸽子基于特定奖惩信息的自动化训练;同步采集了强化学习训练过程中鸽子NCL区神经元电信号,完成了神经元电信号的预处理。(2)提出了一种新的动态强化学习模型。通过对经典Q-Learning模型的学习率和奖励矩阵进行改进,提出一种新的动态强化学习模型,对鸽子在两种训练过程中的行为反馈数据进行分析,并与经典Q-Learning模型对比,结果表明采用动态强化学习模型预测行为的误差分别降低了46.98%与30.55%,同时发现该模型的学习率反映了鸽子在不同训练阶段的内部学习状态。(3)提取了不同训练阶段鸽子NCL区神经元的响应特征,并做了统计分析。通过筛选有效试次响应信号,选取合适的响应时间窗,计算了特定时间窗内的放电频率,作为神经元响应特征;采用曼惠特尼检验分析了鸽子在强化学习过程中NCL区神经元响应特征差异显著性。结果表明,部分(10/60)神经元的响应特征反映了训练中的奖惩信息;部分(21/60)神经元的响应特征包含了鸽子学习状态的信息。该结果说明NCL区的神经元在强化学习过程中扮演了不同的角色。

其他文献

新课程理念下的高中英语课堂分组合作教学初探

我国的普通高校中都存在着应试教育,这会使得很多课程在应试教育中失去其原有的意义。在新课改的要求下,高中英语课堂教学模式也亟待变革,只有对传统课程模式进行更新,才能将

期刊

新课程高中英语课堂分组教学

轨道交通乘客出行路径选择模型研究

在城市轨道交通网络化运营的背景下,一票制及无缝换乘模式在带给轨道交通乘客便利的同时也给运营管理提出了更大的考验。仅仅分析OD数据已经不能掌握乘客在轨道交通网络中的

学位

轨道交通路径选择有效路径客流分配Python

重庆农村基层本土人才职业幸福感实证研究

农村基层本土人才作为农村基层的工作骨干、沟通联系群众的桥梁纽带,是农村基层干部的重要组成部分,在整个农村基层干部队伍建设中有着基础性的作用,他们的职业幸福感情况会直接影响到其工作态度与工作成效。通过对文献资料进行梳理,发现目前关于职业幸福感研究的主要对象是教师、企业员工、公务员、医务人员等群体,而农村基层本土人才是一个新兴群体,很少有学者对其进行研究,且农村基层本土人才的职业特征不同于其他群体,有

学位

农村基层本土人才职业幸福感影响因素差异分析回归分析

后经典语境中的数字叙事理论研究

数字叙事理论作为西方后经典叙事学的重要组成部分,是数字媒介技术与叙事学融合的产物。相对于经典叙事学而言,数字叙事理论更加注重文本的动态性以及由此而产生的空间性和时

期刊

数字叙事数字媒介技术叙事学超文本性交互性

会计准则与所得税法协调:一个理论综述

我国会计准则的国际趋同使得会计准则与所得税法的协调问题日益重要,通过对会计—税收差异的影响因素、经济后果,以及会税一致性优缺点的相关文献进行回顾和讨论,为未来研究

期刊

会计—税收差异会税一致性影响因素经济后果

比武之关公战秦琼

<正>"格斗狂人"徐晓冬与"雷公太极"创始人魏雷在成都的一场对决成为社交网络上的热门话题。徐晓冬仅用20秒取胜,真是让人眼镜大跌。随后他口出狂言,不断表示要挑战"武林门派"

期刊

郭冬临书记员

现代商业空间装饰设计初探

本文基于时代、人文、地域环境等多重因素,进行系统分析的方法,为平衡人与空间装饰要素间的微妙关系而探索、总结出现代商业空间装饰设计的原则与方法,以此丰富商业空间装饰

期刊

商业空间装饰设计原则

中国画写意精神刍议

<正>在传统中国画领城内,写意精神是处处可见的。中国画是中国传统人文思想的结晶,是中国哲学另一种形象性的精神存在。儒、道、禅尤其是庄子哲学思想,对中国画艺术观念的形

期刊

中国画写意写意画以形写神禅宗哲学

研究宇称算符的一种新方法

在量子力学中，宇称算符P^的3种表象积分分别表示为∫d^2z/π｜z〉〈-z｜、∫dq｜q〉〈-q｜和∫dp｜p〉〈-p｜.借助Dirac符号法和量子力学表象的完备性，找到了一种非常新颖的方法，给出了宇称

期刊

宇称算符量子力学表象Dirac符号法

数形结合思想方法在中学数学学习中的应用举例

在数学教学中,教师不仅应注重知识背后的思想方法,而且还要加深思考的层次,促使学生的思维得到训练,使之在学习过程中体会到数学的美感,并形成正确的数学观。由此可见,数学思

期刊

数形结合思想方法数学学习

鸽子视觉—行为抉择的强化学习研究

与本文相关的学术论文