基于Q-learning行为树的人群组行为建模与仿真

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yuleweiyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的发展与国际形势的变化,世界范围内的人员交流越来越频繁,人群密集场所的安全问题越来越突出。为了对人群密集场所中人群的异常行为进行早期预警并据此制定合理的安保措施与应急处理预案,需要对行人的行为机制和行人的群体行为特性进行研究,该研究具有重要的经济与社会意义。而且由2-5个行人所组成的小规模组群体在人群组成中所占的比例达到70%,因此通过对小规模组人群的研究,可以更准确的对人群的行为进行刻画。人群仿真除了对行为生成方法进行研究以外,还需要行人在不同情况下能够进行合理的决策,现有的智能体决策模型广泛使用行为树进行决策,但是行为树的设计存在调试复杂,无法自动化设计,开发效率低等不足。本文在此背景下,研究人员对象的决策模型和组行为的生成方法。本文引入具有自学习机制的多步Q-learning来改进行为树。针对多步Q-learning的不足,本文使用模拟退火策略对多步Q-learning的动作选择策略进行改进,减少对非最优动作选择的概率;本文使用动态规划策略对Q值函数进行逆序更新,加快收敛速度。然后将改进的多步Q-learning算法引入到行为树中,提出了基于改进多步Q-learning的行为树决策模型,使得智能体能够自动的调整行为树,从而产生合适的行为响应。接下来研究了多步Q-learning中n值对算法收敛速度的影响,并确定了最佳n值。将本文算法和普通Q-learning以及SAQ算法进行了对比实验,证明了本文算法收敛速度是最快的。最后设计了警察和异常行为人的行为树,在重要人物视察城市的事件背景下进行对比实验,证明了本文自动设计的行为树比手动构建的行为树更加合理。针对人群的组行为生成方法,本文基于线性插值方法建立了小组队形的数学模型,并提出一种小组队形的动态调整模型,该模型中使用射线探测技术依据不同空间大小来确定小组的队形。本文中利用两级转向系统实现行人在虚拟环境中的运动,第一级系统是组智能体,依据本文改进PRM寻路算法进行全局路径规划,并对PRM算法的节点分布进行了优化且对路径进行了平滑处理。第二级系统是行人智能体,使用A*算法进行局部路径规划,最后设计了对比实验,实验结果表明本文提出的决策模型与人群组行为生成方法能有效提高人群仿真的效果,对基于仿真的公共安全研究具有较好的参考价值。
其他文献
一、县支行监督形式及监督基本情况 当前,县支行的内部监督形式主要有上级监督和同级监督。上级行对县支行的监督体系主要由中支纪委、内审、事后监督和各业务职能部门构成,主
【正】“黄袍加身”这出闹剧,可谓家喻户晓的历史名作。然而,这出戏的首创者并非赵匡胤,而是后周太祖郭威。 后汉乾祐三年(公元950年)十二月,契丹入寇。河北诸州告急,后汉太
期刊
碳纳米管与类金刚石膜都是当今科学界关注的热点材料,对它们独特结构和性质的研究具有重要意义。实验上对单壁碳纳米管的修饰与分离已经作了大量研究,但理论研究较少,本文用量子
经过对CAD制图以及机械制图并同运行优势的分析,笔者对两门课程的教学改革途径提出了建议,通过对CAD制图以及机械制图并同运行教学的研究,认为这种教学方面的尝试可以避免两
冯玉祥集团入主陕甘宁青后,着力移风易俗,改良社会风气,力图使新思潮、新气象鼓荡洗涤西北地区。诸如废除官场旧制,建立新规;严肃军纪,改善民众对军队的恶感;积极倡导妇女放
<正>阮元(一七六四—一八四八)一生结交文士极多,交游甚广,在与前辈的交游中获益良多。他早年与扬州前辈交往密切,曾云:"元居在江淮间,乡里先进多治经之儒,若兴化顾进士文子
职业学校"教学名师"对教师群体的专业发展具有引领、示范和辐射的重要作用。其特有素质应建基于职业学校教师"专业标准"规定的基本素质和普通学校"教学名师"的优秀素质之上,
探讨降低浆纱成本、提高织机效率的工艺措施。以(C 18.2+C 18.2)/OE 83.3 614/212.5 162.6二上一下斜纹品种为例,在综合考虑原纱质量、织造难度等因素的基础上,优化了浆料配
目的比较腹腔镜与开腹手术治疗结肠癌的临床疗效,探讨腹腔镜结肠癌手术的可行性。方法选择我院行腹腔镜结肠癌根治术患者24例及行开腹结肠癌根治术患者21例,比较术中及术后情
<正> 贪污罪在实践中和理论上还存在不少疑难问题,有待于深入研究。本文试从理论与实践的结合上简析贪污罪的司法与立法精神的不协调,并就完善贪污罪的司法及立法问题,提出一