论文部分内容阅读
在医学上,造成不可逆转性失明的视网膜变性疾病诸如视网膜色素变性(Retinitis Pigmentosa,RP)和老年性黄斑变性(Age-related Macular Degeneration,AMD)仍不可治愈。视觉假体的出现让患者有了重见光明的希望。随着科技的发展,目前世界上已经有很多研究小组可以针对视觉通路中的不同区域进行视觉假体植入,并且在临床应用上取得了卓越的成果。但目前视觉假体所产生的分辨率仍远远低于自然视觉的分辨率,因此找寻视觉假体下最优的图像处理策略是本研究的重点。本文设计了两个仿真假体视觉下的识别实验:实验一,使用三种图像处理策略,包括两种传统的边缘提取算法和一种基于感知检测的视频显著性区域检测算法(Saliency-Aware Geodesic,SAG)分别对UCF-101数据库中30个动作视频进行处理,并匹配不同仿真光幻视模板,得到三种不同分辨率(48×48,64×64,128×128)的动态视频。记录并统计不同分辨率和不同图像处理策略下,被试识别动作所用的时间和识别准确率。结果表明,在三种图像处理策略中,相较于其他两种传统的边缘提取算法,SAG明显提升了识别准确率。这是因为SAG算法可以提供给被试更多的灰度信息,并且SAG算法可以自动过滤大部分画面中的冗余信息。在低分辨率的情况,更多的灰度信息可以更好的帮助假体佩戴者识别动作信息。实验二,使用三种图像处理策略,包括直接像素法(The Direct Pixelization,DP),传统的边缘提取算法(The Canny edge detector,Canny)和我们所提出的基于FaceNet的人脸转换汉字系统,分别对来自内蒙古科技大学4名学生所录制作的36个视频(18个站姿组和18个坐姿组)进行处理,并匹配不同仿真光幻视模板,得到三种不同分辨率(36×36,48×48,64×64)的动态视频。记录并统计不同分辨率和不同图像处理策略下,被试识别所用的时间和识别准确率。实验结果表明,在三种图像处理策略中,我们所提出的图像处理策略能够帮助被试在更短的时间内,获得更高的识别准确率。因为当分辨率为36×36,使用我们所提出的人脸转化策略所得到的识别准确率已经到达100%,因此在实验二中,我们还补做了当分辨率减少至24×24时,使用我们所提出的图像处理策略的识别实验。实验结果表明,当分辨率减少至24×24时,平均识别准确率为61.10%。本研究开展的在低分辨的条件下找寻最佳的视频动作识别和人物辅助识别图像处理策略,课以帮助假体佩戴者更好的适应现实生活,并且早日完成独立活动。虽然仿真视觉假体为研究人员提供了一种可以模拟假体佩戴者视觉进行试验的方式,但相比于佩戴者实际视觉感知中不规则的光幻视和分辨率丢失,仿真视觉假体所提供的视觉感知仍处于理想化的情况,这些因素将在今后的研究中加以考虑和探讨。