论文部分内容阅读
水面无人艇(unmanned surface vehicle,USV)是一种无人操作的海洋自主式船只,具有一定的自适应能力。近些年随着无人系统的应用越来越广,USV的智能水平也变得越来越高。但是有时候仍然无法应对一些复杂的环境和棘手的任务。这时就需要人类的认知能力来辅助USV应对复杂的任务形势。USV无人系统的可变自主机制使得USV在执行任务过程中遇到困难时,可以通过人机交互接口向用户请求帮助。USV可以从用户干预的过程中提取出用户所给出的关键信息并进行学习,从而提高自身的自主性。本文主要研究了 USV如何借助用户的帮助来提高自身的自主性。首先介绍了 USV自主等级的划分,并给出了每个自主等级下的人机交互方式,大体上可以归纳为两种交互方式:1)用户向USV提供适合于当前任务形势的规划参数,USV采用该参数对任务进行重新规划;2)用户以手动操控的方式来控制USV的速度和方向。基于这两种交互方式,本文提出了两种提高USV自主性的方法。第一种方法是基于知识库的自主性提高方法。该方法提出了一种具有环境监测,突发事件识别和知识库更新的自主性提高系统框架。并且提出了利用信息熵增益来寻找事态分界点的突发事件识别算法。该方法根据用户给出的任务规划参数,结合突发事件信息来建立导航任务的知识库,并按照一定的规则对其进行更新。在导航任务中利用该知识库,能够使USV的自主性得到提升。第二种方法是基于逆向强化学习的行为模仿学习方法。该方法首先利用主成分分析法从专家策略中提取出若干行为特征。然后利用逆向强化学习算法计算出每个特征的权重,进而求出回报函数的具体表达式。最后利用策略迭代算法得到与专家策略较为接近的最优策略,从而达到了模仿专家行为的目的。最后利用USV的仿真实验平台对上述两种自主性提高方法进行了验证。实验以USV执行导航任务为背景,并加入了多种不确定性因素。从仿真结果和数据分析中可以看出,本文所提出的两种方法能够有效地提高USV应对突发事件的能力,并提高了 USV自身的自主性。