基于QAGKRL的强化学习在线神经解码方法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:lovedengdai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脑机接口将大脑的神经活动通过解码器的解析,转化成可以用来控制外部设备的控制信号,实现了大脑与外界环境的直接交互,为有运动功能缺失的患者带来了一种新的康复途径。现阶段关于神经解码的研究主要是基于监督学习和基于强化学习两大类。相比于需要训练数据的监督学习解码模型,基于强化学习的解码模型的优势在于:(1)无需实际的用户肢体行为数据;(2)允许用户通过试错的方式来动态的操控外部设备;(3)解码模型能自适应神经元发放模式的变化。大脑具有很强的可塑性,环境的变化势必会引起神经元发放模式的改变,强化学习模型这种自适应的特性在脑机接口的解码稳定性中具有重要的作用。本文使用了两只猴子(B04和B10),基于经典center-out伸缩实验范式对强化学习的自适应特性进行了探索,并和经典监督学习方法SVM进行了比较分析。在center-out范式中,猴子通过摇杆控制光标球击打目标球以获得奖赏。同时,用于离线分析的B04神经数据来自于其大脑的双侧初级运动皮层(M1)区,用于在线实验的B10神经数据来自于其双侧背侧前运动皮层(PMd)区。算法部分,我们首先实现了基于误差反向传播(BP)的人工神经网络的强化学习方法(attention gated reinforcement learning,AGREL),和基于径向基函数(RBF)神经网络的强化学习方法(quantized attention gated reinforcement learning,QAGKRL),相比于AGREL有陷入局部最小值的缺陷,该方法能实现非线性神经解码的全局最优解,同时还利用量化方法压缩神经网络的拓扑结构以降低计算复杂度。在离线分析中,我们选用了 10天的数据进行比较分析,综合来看单纯分类时SVM优于QAGKRL,QAGKRL优于AGREL,但QAGKRL和AGREL不经过训练和不需要运动数据就获得了和监督学习方法近似的分类效果,且在样本一的模型上测试样本二时(样本一二分别对应不同两天的神经信号数据集),QAGKRL和AGREL分类正确率下降后能迅速恢复到样本一测试结果的水平,而SVM下降到随机水平后无法恢复。在线脑控采用了在线脑机接口研究中的共享控制方法,引入共享控制参数来帮助猴子适应从手控到脑控的过渡过程,我们发现强化学习方法通过与外部环境的互适应可以获得比SVM方法更高的在线解码正确率,且QAGKRL优于AGREL,同时作为比较在我们切断这种互适应关系后,强化学习方法在线解码正确率降到平均水平以下且低于SVM方法。综上所述,本文在脑机接口相关研究背景下,利用已有资源成功搭建了在线实验平台并在平台上实现了解码模块,扩展了 SVM、AGREL、QAGKRL三种解码算法,先利用离线分析验证了算法和平台的有效性,再进行范式训练和在线实验,实现了猴子脑控光标球的系统功能。
其他文献
该课题主要研究柴油机进气中加入惰性气体(CO和N)时的喷雾、着火、燃烧特性,以及它们对动力性、经济性和排放品质的影响.在一台485Q直喷柴油机上,进行了各转速不同负荷时进气中
热声热机是能实现热能与声能相互转换的一种新型能量装置,热能转化为声能是热声发动机,声能驱动热能泵送是热声制冷机,热声发动机与热声制冷机的耦合成为完全无运动部件的制冷机,因此研究热声发动机的热功转换机理具有重要意义。热声发动机从初始状态到正常运行的过程是起振过程,也是一个建立自激振荡的过程,对热声自激振荡机理的研究有助于进一步了解热声转换实质。本文在全面了解和总结热声理论的基础上,分别从网络理论、动
大肠杆菌O157为重要的食源性病原菌,其主要毒力因子之一是志贺毒素(Shiga toxin),编码志贺毒素的噬菌体为志贺毒素噬菌体(Stx噬菌体)。Stx噬菌体的溶原可使宿主菌产生Stx毒素,导致细
随着炼油工业的发展,石油焦、特别是高硫石油焦成为工业废物.石油焦具有高热值、高焦炭含量、低灰分的特点,把它用作燃料,变废为宝,具有重大的社会经济和环境意义.探求石油焦
1968年由美国工程师Peter Glaser提出了空间太阳能发电(Space Solar Power, SSP)的概念,经过几十年的发展,已取得了很大的成果。我国近年来在这项技术上也有较大的发展和突破,但由于起步较晚,很多关键性技术还不够成熟,导致了空间太阳能发电与地面发电装置相比初始成本偏高,不利于实际的生产需要。因而研究系统动态特性以降低初始投资和运行费用,同时提高系统稳定性已成为当前我国发
本文从提高机组可靠性的问题入手,探讨了上海汽轮机厂所产超速保护系统注油试验装置存在的问题及改进原理。超速保护系统是汽机主要保护之一,根据规程规定,要定期进行注油试验以
本文重點討論了甲骨文中“宜卯”“歲卯”“(蚾)卯”等用牲法詞語連用類的句子結構及語義關係:認爲“宜卯”“歲卯”中的“宜”“歲”是祭祀方式,“卯”是具體用牲法動詞,“
该文以辐射传热的正、逆问题为主要研究内容,重点探讨逆问题的解决方法.该文中的辐射传热正问题分析均采用Monte Carlo方法.对于辐射传热逆问题,一般都以边界辐射强度作为检
纳米银/聚合物复合材料可以实现纳米银独特的生物学及光学性质和高分子材料的优秀的机械性质及生物相容性的有机复合,从而获得一种新型的多功能复合材料。   水辅助法(Bre
该文主要对芳烃渣在盘式连续干燥器中进行干燥时的传热、传质性能进行了理论分析和实验研究,对盘式连续干燥器的结构特性和芳烃渣在干燥盘上的运动规律进行了研究,针对芳烃渣