论文部分内容阅读
智能规划是人工智能领域中,专门在计算机上研究通过预期动作的执行效果,选择合适的动作序列,实现预定目标的过程。智能规划器对其所处环境进行描述,分析候选动作集合及当前的资源限制,制定出可实现预期目标的动作序列,即生成一个有效规划。数学模型和优化技术是解决智能规划问题的工具。智能规划技术已用于多种应用领域。其早期应用可追溯到20世纪70年代,1971年Nilsson等人将智能规划系统STRIPS用于机器人Shakey的动作规划。目前,在供电故障恢复、管道输送、钢厂调度等领域,智能规划技术正发挥着积极的支持作用。此外,集成规划系统,如用于协同搜救及无人驾驶载运的O-Plan;用于运筹规划和生产线调度规划的SIPE-2;用于探测器任务规划以及航天器指令生成规划的ASPEN等在实际应用中也取得了成功。但上述智能规划的研究集中在经典规划的框架下。经典规划一般是在有限确定的状态集下进行动作推理,生成可行的动作序列以实现明确描述的目标。但在网络技术发达的当今社会,规划系统间将不可避免地发生相互作用。基于安全性的考虑,在帮助、协助以及敌对攻击这三大类交互作用中,尤其需要考察敌对攻击作用,既敌意规划。敌意规划是由敌对方执行的,规划目标为对我方不利的规划。对敌意规划进行应对的规划,称为应对规划。敌意规划的识别和应对已超出了经典规划的受限形式。本文构建应激反应的数学模型、讨论应激反应的防御体系,并将其用于应对规划系统——RPDM(Reply Plan with Defense Mechanism)的设计中。应激反应是机体受到应激原刺激时,所引发的一系列非特异的全身适应综合征。应激反应以下丘脑-垂体-肾上腺皮质轴(HPA,Hypothalamic Pituitary Adrenal)和自主交感神经系统(SNS,Sympathetic Nervous System)兴奋为主要特点。人体应激反应是人在恶劣环境中维持生命至关重要的自适应机制,应激反应也因此成为研究具有防御性能规划系统的天然模版。应激反应防御的高效性体现在应激激素参与的调控过程。本文利用圆管层流模型描述应激激素的传播形态,计算应激激素的传播速度。通过流体传质原理分析应激激素的传质过程,推导应激激素的传质方程和调控方程。应激激素的调控方程刻画了应激反应的有效防御时间。机体内、外的任何刺激只要达到应激原的强度均可触发应激反应。下丘脑综合评判机体内、外刺激的强度,决定启动应激反应的时机。通过分析下丘脑的功能,本文从机器学习分类问题的角度模拟下丘脑的信息处理模式。应激反应是机体自适应防御反应,基于应激反应机制构建的规划器,理论上不需要外界环境的全面描述和完备的推理知识。这在很大程度上可摆脱人工控制,有助于将其部署在动态开放的环境中。本文基于应激反应防御体系设计的应对规划系统RPDM包括:敌意规划识别器、防御时程计时器和执行系统。敌意规划识别器判断非己方规划系统执行的规划是否为敌意规划,本文通过分类问题讨论RPDM敌意规划识别器。RPDM防御时程计时器设定了执行系统运行时间的上限。RPDM执行系统在有限时间内启用某个或某些效应器以应对敌意规划动作或者完整的敌意规划的攻击。RPDM效应器封装功能独立的应对规划动作,包括更替动作、清除动作及阻断动作,这三种功能的应对规划动作被分别封装在更替效应器、清除效应器及阻断效应器中。本文所进行的基础性研究具有广泛的应用前景,在自主探测机器人、网络安全以及信息安全的理论研究等方面都极有可能得到重要应用。