【摘 要】
:
导航,是实现水下机器人自主化、智能化不可或缺的一环。自主水下机器人导航需要机器人获取水下环境信息,依据获取到的信息规划一条从起点到目标点的最优无碰路径,水下机器人
论文部分内容阅读
导航,是实现水下机器人自主化、智能化不可或缺的一环。自主水下机器人导航需要机器人获取水下环境信息,依据获取到的信息规划一条从起点到目标点的最优无碰路径,水下机器人根据该路径进行游动。传统的路径规划算法如模糊算法、神经网络等一般需要水下机器人事先知道所处环境,但一般情况下水下作业环境并不可知;另一方面,水下任务的复杂度也在不断增加,需要多个机器人相互协作完成任务,在双重因素作用下,传统的算法越来越难以满足需求。强化学习的出现,使水下机器人自主探索环境并自主学习出最优路径成为可能。在强化学习的基础上,水下机器人不需要知道所处的环境,仅仅依靠本身对环境的探索与学习便能够规划出从起点到目标点的最优无碰路径。因此,本文在强化学习的基础上,对多个自主水下机器人的路径规划问题展开研究。本课题的主要研究工作如下:(1)对一种特殊的水下机器人——仿生机器鱼——展开研究,提出一种新型结构设计方法。根据真实鱼体的尺寸数据,结合最小二乘法,对机器鱼的轮廓曲线进行拟合,得到一条拟合曲线函数。由此,设计出一种单关节机器鱼。(2)以强化学习为基础,利用模拟退火算法对算法的“探索与利用”平衡问题进行优化,对单个机器鱼的路径规划问题展开研究。提出一种基于目标导向思想的奖赏函数,并对算法的停止条件进行优化,形成一种改进的模拟退火-Q学习算法。在此基础上,分别在静态环境与动态环境下对单个机器鱼进行仿真分析。(3)在上一步的基础上,对多个机器鱼的路径规划问题展开研究。分别从动作策略与奖赏函数两个方面优化适用于多个机器鱼路径规划问题的模拟退火-Q学习算法。先后以两个机器鱼和三个机器鱼为例,分别在10?10和20?20的环境下进行仿真分析。更进一步地,以三个机器鱼为例,在100?100的环境下进行了仿真分析。(4)对所设计的机器鱼进行样机制作与调试,进行静态实验分析以验证其平衡性与密封性,对机器鱼进行直线游动实验分析,并在改进模拟退火-Q学习算法的基础上,对单个和多个仿生机器鱼的路径规划实验进行分析。
其他文献
一向被认为很难打破垄断的城市市政公用行业,现在正加快走向市场.前不久,建设部发出关于加快市政公用行业市场化进程的通知,国家第一次以政府文件形式确定市政公用行业改革方
LBO交易起源于20世纪60年代中期,兴盛于80年代中后期,其间涌现了一大批专门从事杠杆收购交易(LBO)的著名机构和人士.20世纪90年代初期,LBO市场盛极而衰,急剧萎缩,陷入低迷.
香港恒生指数各参考条目表明,进入2003年以来,电信股表现出色,中国移动(香港)、中国电信、和记黄埔、电讯盈科等电信股长期名列前五大成交金额股票.事实上,从新年的第一个交
九省通衢的武汉,不仅拥有得天独厚的地理优势、秀美风光,同时也拥有日新月异的发展和多如繁星的先进人物与事迹.可以说:武汉是座亮点频闪的城市.
江村,座落在风景秀丽的黄山脚下,距黄山景区三十多公里,205国道依村而过。江泽民主席祖辈就生活在这里。2001年5月21日,江泽民亲临江村,瞻仰祖居,探望乡亲,并题字留念。 江村建村近1400年。据江氏宗谱记载,夏禹国相伯益子玄仲,被禹的儿子启封于江地,是为江氏始祖。江玄仲第86世孙文学家江淹是南北朝梁时考城人,任宣城太宗。江淹五世孙江韶遍游黄山白岳,终择旌西金鳌山族居,始称江村。 江村,枕山
试验旨在研究复合微生态制剂产品肽菌素对断奶仔猪生长性能、腹泻率及微生物菌群等的影响。试验选取45头定远黑断奶仔猪,随机分为3个组,对照组饲喂基础日粮,试验组在基础日粮
研究背景食管癌、胃癌、结直肠肛门癌是当前主要的消化道癌症类型,三者总死亡人数占苏州市全部癌症死因的31.0%。研究表明消化道癌症的死亡变化趋势与年代、年龄有关,但目前尚无关于消化道癌症未来死亡率预测的研究报道。研究目的了解2002-2016年苏州市居民食管癌、胃癌、结直肠肛门癌的死亡特征。建立Lee-Carter死亡率预测模型分析死亡变化趋势,并预测未来10年的年龄别死亡率,从而进一步为政府及其相
国际集装箱运输始于本世纪50年代,因其具有装卸快、货损货差少,可以实行从发货地工厂到国外收货人仓库“门到门”运输,于货方、船方、港口都有利,被誉为一场货物运输的革命。集装
非典影响经济发展的特征与机制非典的传播本身不是经济危机,但它是可能造成经济危机的外在冲击.他对经济的影响有两方面作用.一是负面影响,放慢经济增长步伐.二是正面影响,刺
在新的形势下,省级煤炭行业管理部门如何履行行业管理职能,从计划型政府向市场型政府转变,从决策政府向参与型政府转变?陕西省煤炭工业局找准了位置,强化了行业职能管理,促进