基于视频显著性仿真假体视觉动作识别研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:r9kobe24
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在医学上,造成不可逆转性失明的视网膜变性疾病诸如视网膜色素变性(Retinitis Pigmentosa,RP)和老年性黄斑变性(Age-related Macular Degeneration,AMD)仍不可治愈。视觉假体的出现让患者有了重见光明的希望。随着科技的发展,目前世界上已经有很多研究小组可以针对视觉通路中的不同区域进行视觉假体植入,并且在临床应用上取得了卓越的成果。但目前视觉假体所产生的分辨率仍远远低于自然视觉的分辨率,因此找寻视觉假体下最优的图像处理策略是本研究的重点。本文设计了两个仿真假体视觉下的识别实验:实验一,使用三种图像处理策略,包括两种传统的边缘提取算法和一种基于感知检测的视频显著性区域检测算法(Saliency-Aware Geodesic,SAG)分别对UCF-101数据库中30个动作视频进行处理,并匹配不同仿真光幻视模板,得到三种不同分辨率(48×48,64×64,128×128)的动态视频。记录并统计不同分辨率和不同图像处理策略下,被试识别动作所用的时间和识别准确率。结果表明,在三种图像处理策略中,相较于其他两种传统的边缘提取算法,SAG明显提升了识别准确率。这是因为SAG算法可以提供给被试更多的灰度信息,并且SAG算法可以自动过滤大部分画面中的冗余信息。在低分辨率的情况,更多的灰度信息可以更好的帮助假体佩戴者识别动作信息。实验二,使用三种图像处理策略,包括直接像素法(The Direct Pixelization,DP),传统的边缘提取算法(The Canny edge detector,Canny)和我们所提出的基于FaceNet的人脸转换汉字系统,分别对来自内蒙古科技大学4名学生所录制作的36个视频(18个站姿组和18个坐姿组)进行处理,并匹配不同仿真光幻视模板,得到三种不同分辨率(36×36,48×48,64×64)的动态视频。记录并统计不同分辨率和不同图像处理策略下,被试识别所用的时间和识别准确率。实验结果表明,在三种图像处理策略中,我们所提出的图像处理策略能够帮助被试在更短的时间内,获得更高的识别准确率。因为当分辨率为36×36,使用我们所提出的人脸转化策略所得到的识别准确率已经到达100%,因此在实验二中,我们还补做了当分辨率减少至24×24时,使用我们所提出的图像处理策略的识别实验。实验结果表明,当分辨率减少至24×24时,平均识别准确率为61.10%。本研究开展的在低分辨的条件下找寻最佳的视频动作识别和人物辅助识别图像处理策略,课以帮助假体佩戴者更好的适应现实生活,并且早日完成独立活动。虽然仿真视觉假体为研究人员提供了一种可以模拟假体佩戴者视觉进行试验的方式,但相比于佩戴者实际视觉感知中不规则的光幻视和分辨率丢失,仿真视觉假体所提供的视觉感知仍处于理想化的情况,这些因素将在今后的研究中加以考虑和探讨。
其他文献
实体类型是知识图谱的重要组成部分,在知识图谱的应用中起到了重要的作用,但知识图谱中普遍存在实体类型缺失与不完全等质量问题。为了解决这个问题,通常采用机器学习分类方
波长选择开关(WSS)是新一代可重构光分插复用(ROADM)全光网络中的核心光学器件之一。基于硅基液晶(LCoS)技术的波长选择开关具有的波长无关、方向无关、无竞争性、无格栅(CDC
西服的质量直接关系到西服制造企业的经济效益及信誉荣誉。现有的西服质量管理研究主要关注于成品合格率或事后的质量评价,缺乏西服加工过程的质量监管,使其难以发挥实效。针
在当今这个竞争愈来愈激烈的社会中,融资方式的便捷与完善是企业获取竞争优势和长远发展的重要保障。债务融资是一种主要的融资方式,债务融资成本是公司经营管理中考虑的关键
随着经济全球化的不断完善以及信息技术的快速发展,信息在国际市场间的传导越来越便捷,市场间关系也越来越紧密,在金融自由化不断深入的环境下,对于市场间相关性的研究更具有重要的理论意义;近年来,中国的经济发展令人瞩目,中国股市更是对我国经济起着极度重要的作用,研究我国股票市场在国际市场中的影响力更具有一定的现实意义。本文的研究分为两个层次,首先,选取了包含外汇、股票、原油、以及商品期货市场在内的共十三个
丘脑是人脑的中转站,接收除嗅觉外的所有感觉信号,并传递至大脑皮层区域。丘脑可以划分为多个核团,并且每个核团有其特定的功能。核团与特定皮层区域存在连接或者成为皮层连
石油、天然气作为一种燃料与化工原料,在生产生活中具有极为重要的作用。管道运输是油气资源长距离运输最主要的方式,因管道破坏的危险性,对其周界入侵事件识别的研究一直受
医学图像诊断在计算机辅助诊断,临床手术等领域发挥着重要的作用,同时它也是一项具有挑战性的工作。作为协助医生进行医学图像诊断的重要工具,医生对于医学图像配准算法的要
属性签名除了与属性加密一样可以进行细粒度访问控制之外,还具有通常数字签名所不具备的隐私性(Privacy),因此具有重要的理论意义和广泛的应用前景。不可否认签名是一种可防
本文主要研究了非绝热量子泵浦双势阱和赝自旋为1的Dirac-Weyl系统中的输运性质。在双势阱结构中,量子阱中的能带结合会产生成键态和反键态,同时,它们所对应的波函数也会存在