基于强化学习的植入式脑机接口神经信息解码:算法设计及应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yangyilong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脑机接口直接将大脑的运动信息解析成外部设备的控制指令,实现了大脑与外界环境的直接交互,为残障患者重建运动功能提供了一种新的途径。目前主要的神经解码算法分为基于监督学习和基于强化学习两大类。相比于基于监督学习的解码模型,基于强化学习的神经解码的特点在于:(1)无需实际的用户肢体行为数据;(2)允许用户通过试错的方式学会动态地操控外部设备。这类解码算法可以追踪到时变的神经活动,并实现用户和解码器的相互适应,能够保持长期稳定的解码性能。目前,该方向的研究主要集中在离散、简单的任务上。但是,脑机接口任务日益复杂多样,传统的强化学习算法难以满足其解码要求,而尚无针对复杂任务的强化学习解码算法的相关研究报道。本文研究基于强化学习的神经解码关键技术,聚焦于连续、复杂任务中状态-动作空间大而探索困难,时间信用分配导致学习速度慢,以及神经信号中混有噪声导致自适应解码性能降低等存在的难点问题。针对上述挑战,本文采用高效的强化学习算法探索复杂的神经状态-动作空间,重建连续的运动轨迹;结合核自适应滤波器理论,设计新的解码算法实现非线性解码的全局最优解;引入相关熵抑制噪声对自适应解码性能的影响,从而实现鲁棒、稳定的神经解码。本文的主要研究内容及创新点如下:1.针对复杂神经状态-动作空间中探索困难的问题,本文提出采用attention gated reinforcement learning (AGREL)算法预测center-out任务中连续的2D摇杆轨迹。AGREL利用即时奖赏更新参数而不易受初始值影响,以及softmax策略依据概率选择最优与次优动作以避免解码性能的波动。与传统的Q学习算法相比,AGREL将预测轨迹和真实轨迹之间的相关系数提高了5.88%,均方误差则降低了41.66%,平均总目标到达率提高了28.01%。此外,相比于静态模型,自适应的AGREL保持多数据段的解码精度在85%以上,延长了脑机接口系统的使用时间。2.针对以往方法只分配时间信用而导致训练时间过长的问题,本文提出空间信用分配,实现在多物体的复杂环境中区分潜在目标。结合AGREL高效的误差信号机制与核自适应滤波器理论,本文首次设计了quantized attention gated reinforcement learning (QAGKRL)算法,实现非线性神经解码的全局最优解。该算法还利用量化方法压缩神经网络的拓扑结构以降低计算复杂度。与AGREL相比,QAGKRL在避障任务中的平均成功率显著提高,保证了解码的准确性和稳定性。3. 针对由神经信号中噪声降低解码精度的问题,本文引入最大相关熵准则作为AGREL和QAGKRL的优化函数,能够降低解码模型对异常值等噪声的敏感性,从而提高解码性能。基于最大相关熵准则的AGREL和QAGKRL在避障任务中的平均总成功率分别提高了12.56%和6.08%。综上所述,本文尝试解决了基于强化学习的脑机接口中连续、复杂任务的神经状态-动作空间探索困难问题、空间信用分配问题以及神经信号的降噪问题。本文深入探索了一系列基于强化学习的解码算法,并应用于复杂多样的任务,实现了稳定、鲁棒的神经解码,为脑机接口的未来发展打下了坚实的基础。
其他文献
近年来,致密油已成为全球非常规油气勘探开发的重要领域之一。通过对巴肯、鹰滩等美国典型致密油开发区域和长庆油田、新疆环玛湖区域的致密油开发地面建设模式和技术等的分
为了推进国家“乡村振兴”战略的实施,加快现代农业示范园的建设成为增强农业创新发展的必由路、产业转化升级的中转站和科技成果落地的实验田。现代农业示范园能以点带面推动农业产业发展,起到引领农业高科技的示范作用,但目前我国农业园建设用地占农业用地的比例不到2%,农业示范园作为促进我国现代农业发展的主体责任和功能尚不明确,综合效益也有待提高。本文以草庙集乡现代农业示范园为研究对象,对示范园内的区位条件、生
下列单位为我所直属实体,可向社会提供全方位果业科技服务,包括果园建立、果品经营、种苗提供、农药肥料、技术咨询、化验分析、技术承包、人员培训、协作联营、综合开发等与
<正>4月29日是2019北京世园会倒计时一周年的重要时间节点。4月28日上午,在北京延庆区八达岭国际会展中心,举办了以"花开新时代"为主题的2019北京世园会倒计时一周年活动。北
执行力是反映组织工作素质的重要因素。对于乡镇组织而言,执行力决定了其工作效率。现阶段,我国正在全力建设社会主义新农村,致力于加快城镇化的建设,提高乡镇组织执行力度,
【正】姜澎爱好工艺美术创作,他 认为要使工艺品走入平常百姓 家,就要走出一条工艺品商品化 的道路,降低成本,改变传统式 的手工作坊,对工艺品进行批量 生产,几年来,他做过许
对大脑功能原理的探讨已成为当今科学研究的热门课题。本课题就大脑对连续刺激信号的诱发电位响应特性进行了研究。本课题采用成对刺激模式(paired-stimuli paradigm),研究了
土壤种植管理不科学,可导致镰刀菌(Fusarium spp.)成为土壤优势菌,侵染花生(Arachis hypogaeaL.)而致其发生根腐病;木霉(Trichoderma spp.)是土壤和植物根际常见真菌、重要生
人工关节应用于临床已有近百年的历史,自charnley开创现代人工关节置换技术以来也已近半个世纪,但人工关节置换仍然存在一些问题,术后假体的无菌性松动就是其中之一。引起关节假
本文通过对贵州毕节市CK1地热井的特点及施工的研究,有效解决了高陡构造地层钻进问题。该井开孔即见基岩,常规工艺加压困难,难以保证孔斜;下部钻孔岩石硬度大,研磨性较强,可