基于强化学习的无人自行车侧向平衡控制研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:zhangchenglin427
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
纵观无人自行车自平衡控制的发展历程,虽然使用传统控制器已经实现对无人自行车的平衡控制和轨迹控制。但是,这些控制全部或部分受限于较为理想的路况和环境之中,当无人自行车处于不同的路况,或者行走于未知的动态变化环境中时,传统控制器并不能让无人自行车适应环境,需要重新调整参数,以达到稳定状态。本论文采用一种强化学习的策略--反应式认知学习系统,依靠无人自行车与环境交互,展开无人自行车自平衡运动控制研究。无人自行车结合反应式认知学习系统,可以弥补传统控制对动态环境适应能力弱这一短板,增强无人自行车的环境适应能力,在变化的环境中实现稳定的侧向平衡控制。本论文针对无人自行车反应式认知学习系统中的几个关键问题进行研究,主要研究内容如下:1)分析、选择合适的分类方法,构建研究无人自行车反应式认知学习系统中的状态分类模型。采集无人自行车平衡运动数据,构建线性判别分析状态分类模型,并对该模型进行评价分析。2)对反应式认知学习系统中不确定函数进行研究与改进。在原不确定函数随学习时间和学习次数降低,导致学习动机逐渐下降的前提下,本论文对不确定度函数进行改进,让学习动机在随时间降低的过程中,部分提高,以此提升系统的学习动机,增加系统的探索性。3)对反应式认知学习系统中评价矩阵、学习系数α、β的选取进行研究。将固定参数评价矩阵设置为可动态调整的评价矩阵;优化学习系数α函数的计算,让α值随状态改变进行调整;选择合适的β值。综合改进上述学习策略,实现无人自行车反应式认知学习系统的优化,提高学习效率和学习品质。4)利用MATLAB/Simulink搭建反应式认知学习模块框架进行运动控制仿真。对线性判别分析模型与模糊分类进行仿真对比分析,通过仿真结果证明采用线性判别分析模型分类的方法,可以让学习收敛速率更快,无人自行车横滚角学习振荡更小,且其学习至平衡状态时,收敛范围更小,验证了采用该方法的可行性;设置不同初始期望值进行仿真对比分析,通过仿真结果证明适当的调整自动机组初始期望值,可以提高学习效率,降低学习时长,为后续物理样机实验奠定了基础。5)采用改进后的反应式认知学习系统,展开物理样机自平衡学习实验。利用部分反馈线性化控制器进行物理样机实验,采集基于部分反馈线性化无人自行车自平衡状态数据,作为状态分类的基础数据,构建线性判别分析状态分类模型;参考仿真实验过程,对无人自行车物理样机展开反应式认知学习系统的实验,实验结果证明改进后的系统对无人自行车侧向平衡自学习有效学习时间更长、对无人自行车侧向平衡调整能力更优、无人自行车在平衡学习状态时,其横滚角收敛范围更接近平衡范围。本论文探索反应式认知学习系统,对无人自行车侧向平衡运动控制的应用问题。针对反应式认知学习系统中的几个关键问题,进行深度分析研究与探讨,通过MATLAB/Simulink仿真,验证改进后的反应式认知学习策略,对无人自行车侧向平衡运动控制的可行性,然后在无人自行车物理样机上进行学习实验,实现无人自行车的侧向平衡运动控制。
其他文献
在人工智能行业迅速崛起的今天,如何精确地获取姿态信息已成为无人系统控制的关键。随着惯性技术的不断发展以及信息融合算法的迭代更新,多传感器融合姿态解算弥补了传统单一传感器误差大的缺陷。高精度、低成本、易携带成为了姿态测量系统的代名词,但现有的大多数产品都与低消费市场的供求关系产生了矛盾。针对上述现象,本课题将对无人系统姿态解算的一些关键性问题进行研究。首先,针对姿态测量系统存在成本和精度之间的矛盾问
学位
研究目的:1.实验一:探讨便携超声引导下制作以髂动脉破裂出血为代表的交界部位损伤出血模型的可行性。2.实验二:探讨便携超声引导球囊阻断术对髂动脉破裂出血止血的效果。3.实验三:探讨掌上超声在野战环境下建立髂动脉枪弹伤大出血动物模型的应用价值。研究方法:1.实验一:选择12只五指山猪,实验前采集血压、心率、腹腔积液最大深度、腹主动脉及两侧髂动脉内径等基线数据。选择一侧髂动脉,采用16G一次性穿刺活检
学位
目的:探索居家心脏康复(HBCR)和中心心脏康复(CBCR)对稳定性冠心病患者疗效的影响。方法:选取2018年11月至2019年10月在我院心脏康复中心门诊就诊的18-80岁的稳定性冠心病患者,采用随机数字表和信封法将患者分为HBCR组和CBCR组,分别以HBCR或CBCR干预3个月。对比2组患者干预前、后的心肺功能[峰值摄氧量(peak VO2)、无氧域(AT)、二氧化碳通气当量(VE/VCO2
学位
研究背景疾病谱是将疾病按照患病率由高到低的顺序排列而成,它反映了当前疾病的流行状况和居民的健康水平。随着我国经济社会快速发展、医疗技术水平不断提高、人口老龄化速度加快,中国居民疾病谱从过去的以传染性疾病为主向高血压、心脏病、脑卒中、肿瘤等慢性非传染性疾病转变。所以掌握当前居民疾病谱特点能够帮助了解目前威胁居民健康最主要的疾病种类,从而有效指导医疗卫生资源的合理配置,并为疾病防控工作实施和卫生政策制
学位
目的:1.比较与评价加减温经汤两种预煎颗粒治疗军地女青年寒凝血瘀型痛经的临床疗效及安全性;2.评价加减温经汤两种预煎颗粒对上述军队患者焦虑、抑郁状态及体能状况的调整作用。方法:1.将311例寒凝血瘀型痛经患者分为单煎制粒组103例、合煎制粒组109例、安慰剂组99例,分别给予加减温经汤单药煎取制成的配方颗粒和混合煎取制成的合煎颗粒,以及安慰剂颗粒,疗程8周。以痛经症状评分和疗效为主要评价指标,以伴
学位
研究背景与目的:急性动脉血栓形成通常是由不稳定的动脉粥样硬化斑块破裂或侵蚀所引发的凝血级联反应,往往具有症状隐匿和瞬间突发的特点,患者常以致死性血栓形成事件为首发症状,具有较高的致死率和致残率。在血栓形成早期病变局部活化的凝血酶含量升高,有研究将活化的凝血酶作为血栓形成的早期分子标志物,对凝血酶活性进行检测,实现血栓形成的分子成像。近年来随着分子影像学(Molecular imaging)和纳米生
学位
人们对锂离子电池的需求日益增长,寻找容量高、倍率性能好和循环稳定的锂离子电池正极材料成为当下研究的热点。富锂锰基材料因其具有高比容量、高安全性及绿色无污染等优势成为最具潜力的研究对象。但是在充放电过程中面临晶格氧析出、自身倍率性能差等问题,严重阻碍了富锂锰基材料的商业化应用。本文以高安全性和高理论比容量的Li1.2Mn0.6Ni0.2O2(LMNO)为研究对象,通过密度泛函理论(DFT)从分子/原
学位
学位
35CrMo钢强度高,淬透性及韧性较好,常用于制造各种大型机械设备的零部件,在制造业中应用广泛。然而,35CrMo钢的硬度和耐磨性还相对较低,不能完全满足特殊工况条件以及使用寿命的要求。对比常规热处理,近年来迅速发展的电子束表面淬火技术具有能量利用率高及加工精度高等优点,能够显著改善材料表面的各项性能。本文以35CrMo钢为研究对象,基于传热学及有限元方法等理论,通过ANSYS有限元分析软件建立了
学位
聚焦家庭迁移经历对儿童认知发展的影响,并根据中国家庭追踪调查(CFPS)2012—2018年四轮调查数据进行实证研究,发现父母外出对农村留守儿童的语文和数学成绩均有显著负向影响,且母亲单方外出对儿童负向影响更大;男孩较女孩受到母亲单方外出的影响更显著,低年级儿童较高年级儿童更易受到父母外出的负向影响。为减少家庭迁移经历对儿童认知发展的负向效应,建议通过优化户籍制度、促进外来务工人员定居城市以及鼓励
期刊