基于快速图—声转换的视障者视觉辅助系统研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:sinolee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉是人类感知外部世界最主要的方式,我们所获取信息的80%以上均来源于视觉。根据相关资料显示,中国是全世界盲人最多的国家,且盲人数量在以每年45万的速度增加,因此解决盲人日常生活及其安全出行成为了亟待解决的社会问题。在众多的视障者视觉辅助方法中,图像-声音转换是一种普遍适用的方法,它通过将摄像机实时获取的图像信息转换为声音信号来实现视障者对环境的了解。OIC系统就是采用了这种图-声转换的方式来帮助视障者了解周围环境,且已有相关产品面市。  但经研究发现,OIC系统存在两个问题。一是OIC系统将拍摄到图像的全部内容转换成声音信号,与人类观察周围环境的习惯不符,没有采用人类视觉关注的特点;二是OIC系统使用难度大,学习使用OIC系统相当于学习一门外语。且为了进一步减少图-声转换所需的时间,提高系统的实时性表现,本文进行了深入的研究并提出了相应的解决办法。至此,本论文的主要工作和创新点主要有以下内容。  针对OIC系统存在的问题,本文提出了IOIC(Improved OIC)系统,该系统主要分为两个部分来实现视障者的视觉辅助。首先,对所采集的图像进行目标信息提取。经过研究比较了视觉选择注意模型以及图像分割的相关算法,最终在IOIC系统中选择采用Itti视觉选择注意模型和Snake图像分割模型来实现目标信息提取的过程。然后,将提取出的目标信息转换成声音信号。在此,本文提出了基于剪枝IFFT算法的快速图-声转换方法,它的原理是将图像每列的频域信息作为离散傅立叶变换(DFT)的变换结果,通过利用快速傅立叶反变换(IFFT)实现音频信号的计算,又为了降低图-声转换的计算复杂度,选择剪枝IFFT对该计算过程进行简化。  本文通过六组图-声转换实验证明了本文提出的IOIC系统有效的降低了映射而成的声音信号的复杂度,更便于使用者理解掌握,且在图-声-转换过程中大幅度的减少了转换所需的时间,提升了系统的实时性。
其他文献
由于环境变化、降采样等原因导致采集到的监控视频图像质量较低,给事物细节特征的分辨带来不便。然而,通过硬件方法提高图像质量不仅成本高而且周期较长,所以采用超分辨率的
随着互联网的普及,各种各样的基于互联网的应用层出不穷,这些新型的应用对互联网提出了不同的需求,使得现有的互联网架构面临着很大的挑战,互联网发展呈现出僵化现象。在这种
在新一代无线移动通信系统中,相干检测、数据的解调和译码、信道质量的测量以及用户定位等过程,都需要通过信道估计来获得信道状态信息。因此,信道估计是蜂窝无线通信系统如L
近年来随着移动通信技术的迅猛发展,越来越多的无线终端设备接入到通信网络,造成频谱资源严重匮乏。与此同时,现有固定频谱分配方式的授权频段内的频谱大多处于空闲状态,频谱利用
近年来随着生活质量的提高,以及缺乏锻炼,使得我国急性病的发病率逐年增加,由急性病导致的死亡率也在增加,尤其是由于猝死导致死亡的人口正在急剧上升。在我国由于医疗资源分
随着电子信息时代到来,高精度同步授时系统不仅在国防建设、太空探究领域扮演着重要的角色,而且在通信系统、电力系统、无线传感网络等领域得到了普遍应用。当代同步授时系统
无线电定距技术是通过发射调制过的电磁波探测目标,目标反射的回波信号通过接收天线接收,经过一系列信号处理后获得目标的距离和速度信息。本论文主要介绍的是伪随机码键控定
钢丝绳芯输送带是带式输送机牵引和运载的重要部件,已广泛应用于煤炭、矿山、港口、电力、冶金、化工等领域。在使用过程中,由于钢丝绳芯输送带超负荷运载,被废钢铁、矸石等异物
本文围绕大规模天线阵列自适应波束形成处理器的实时实现问题,探索如何采用基于图形处理器(GPU)的并行处理架构,改造现有的自适应波束形成算法,以提高自适应波束形成处理器实
在石油探测中,随着石油开采程度的提高,对于各向异性地层的探测需求日益增加。而传统的感应仪器只能测量地层的水平电阻率,容易漏掉、低估甚至错判各向异性的油藏。三维感应