论文部分内容阅读
传统图像配准方法中,图像特征的表示和相似性测度的选择易受到人为因素的影响,不能准确地表征图像特征和配准图像的相似度,从而对配准结果产生较大误差.针对此问题,借助端到端的强化学习方法,对这2个部分进行隐式的表达,从而避免人工设计的缺陷.具体而言,设计了一个人工智能体模型,由策略网络和价值网络2部分组成,用以指导浮动图像朝着参考图像的方向正确移动,进而实现图像配准.提出使用异步表演者-评论家方法进行模型训练,以避免经验回放操作,降低模型训练对存储容量的要求并加快模型的收敛;同时提出一种奖赏函数,能够给予