基于增强学习的大鼠机器人空间导航方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:f520li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于脑机接口的动物机器人系统,是以动物为载体,将外部控制指令转化为各种形式的有效刺激施加给动物大脑,从而直接干预动物的感受并控制其行为。随着实际应用的需求越来越迫切,精确有效的自动控制研究成为动物机器人发展的必然趋势。大鼠机器人导航问题研究一直是衡量自动控制效果的有效实验平台;同时,自动控制过程也具体展示了生物智能与人工智能的融合方式。  本文以大鼠机器人为研究对象,以自动导航问题为研究目标,提出了基于增强学习的自动导航方法,实现了未知环境中的空间奖赏地图重建,并最终实现动物机器人行为的自动控制,体现了智能融合的独特优势。其具体内容包括:  (1)分析大鼠自身导航相关行为(觅赏行为和试错学习)与人工智能常用方法在本质上的相关性,以增强学习为框架,探究生物智能和人工智能融合。  (2)采用Q-learning和Actor-Critic方法构建导航行为的空间奖赏地图,融合生物智能后,使得机器增强学习算法具有更快的收敛性。  (3)提出分级电刺激奖赏的自动导航方法。在空间奖赏地图的基础上,将环境奖赏地图转化为分级的电刺激奖赏,依赖大鼠自身对不同强度电刺激奖赏的感知,加快其在空间探索中形成奖赏认知地图的过程,并自主学习导航任务,真正体现了人工智能和生物智能的相互融合。  此外,本文还通过对照大鼠在仅依赖生物智能的情况下完成导航任务的情况,进一步证明了智能融合方法对于完成自动导航任务具有明显的优势。
其他文献
随着时延容忍网络在现实生活中不断得到应用,其主流路由策略设计不足导致的性能瓶颈日益突出。理想的路由策略应该在能耗较低的前提下使时延容忍网络的传输性能达到最优,然而
动物机器人在运动的灵活性、能源供给、环境适应性等方面相比传统机器人具有很大的优势,在环境侦查和灾难搜救等方面的应用前景十分广阔,然而现实中将动物机器人用于未知环境探
随着电子纸显示技术的推广与应用,我们对电子纸已不再陌生,电子纸不仅是一种纸的替代品,而且是具有很大发展潜力的未来显示设备,电子纸显示技术分为很多类型,目前市面上最具代表性
随着科技日新月异的进步,各种各样的数据充斥着生产生活的各个领域,如何有效地获取数据中的精华并运用到各行各业中去,成为科研人员关注的焦点。基于这一实际需求,数据挖掘技术应
随着计算机技术的不断发展,社会环境的日益复杂,日常生活中对于安全的需求越来越高。人脸识别技术作为日益成熟的生物特征识别技术,通过比较人脸的生物特征信息来对身份加以
随着互联网、数码相机(特别是具有拍照功能的智能手机)和图像编辑工具的快速发展和大规模普及,网络上的图片数量成爆炸式增长。如何在互联网上海量图像中找到用户所需要的图
离群检测是数据挖掘的重要分支,离群数据对象隐藏着非常重要的信息和知识,发掘并运用这些财富推动着离群检测的研究。在理论上,研究者们对离群检测的研究取得了巨大的成功。在
对汉语复句中关系词的自动标识是中文信息处理中的一个研究难题,本课题组前期已经研究的“基于规则的复句关系词自动标识系统”所使用的规则是通过人工的方式挖掘的。该系统
随着计算机网络技术和信息技术的不断完善和快速发展,信息安全重要性越来越受到重视。在网络环境中,数字签名技术具有较高的安全度,可以确认发件人的身份,具有认证功能,避免
随着物联网发展,RFID作为物联网的关键推动技术备受关注,中国于2009年超过英国,成为了仅次于美国,全球开展RFID项目数量排名第二的国家。RFID射频识别技术具有非接触性、使用