论文部分内容阅读
视觉是人类感知外部世界最主要的方式,我们所获取信息的80%以上均来源于视觉。根据相关资料显示,中国是全世界盲人最多的国家,且盲人数量在以每年45万的速度增加,因此解决盲人日常生活及其安全出行成为了亟待解决的社会问题。在众多的视障者视觉辅助方法中,图像-声音转换是一种普遍适用的方法,它通过将摄像机实时获取的图像信息转换为声音信号来实现视障者对环境的了解。OIC系统就是采用了这种图-声转换的方式来帮助视障者了解周围环境,且已有相关产品面市。 但经研究发现,OIC系统存在两个问题。一是OIC系统将拍摄到图像的全部内容转换成声音信号,与人类观察周围环境的习惯不符,没有采用人类视觉关注的特点;二是OIC系统使用难度大,学习使用OIC系统相当于学习一门外语。且为了进一步减少图-声转换所需的时间,提高系统的实时性表现,本文进行了深入的研究并提出了相应的解决办法。至此,本论文的主要工作和创新点主要有以下内容。 针对OIC系统存在的问题,本文提出了IOIC(Improved OIC)系统,该系统主要分为两个部分来实现视障者的视觉辅助。首先,对所采集的图像进行目标信息提取。经过研究比较了视觉选择注意模型以及图像分割的相关算法,最终在IOIC系统中选择采用Itti视觉选择注意模型和Snake图像分割模型来实现目标信息提取的过程。然后,将提取出的目标信息转换成声音信号。在此,本文提出了基于剪枝IFFT算法的快速图-声转换方法,它的原理是将图像每列的频域信息作为离散傅立叶变换(DFT)的变换结果,通过利用快速傅立叶反变换(IFFT)实现音频信号的计算,又为了降低图-声转换的计算复杂度,选择剪枝IFFT对该计算过程进行简化。 本文通过六组图-声转换实验证明了本文提出的IOIC系统有效的降低了映射而成的声音信号的复杂度,更便于使用者理解掌握,且在图-声-转换过程中大幅度的减少了转换所需的时间,提升了系统的实时性。