论文部分内容阅读
在语音控制系统日益普及的今天,语音接口承载的功能越来越强大,如移动支付、智能家居控制甚至汽车自动驾驶系统都使用了语音控制系统,本论文基于智能语音系统从硬件角度出发对上层软件耦合的安全性展开研究。论文的研究方向是:通过设计一种人耳听不到的语音命令Silent Ultrasound Attack,将声音命令调制在超声波范围(例如,f>20kHz),利用麦克风电路的非线性作用,将语音指令以人耳听不到的高频率信号攻击智能设备(如手机),同时会基于FFT原理,利用CVI系统分析函数对高频率信号进行信噪比测量,来表明高频率信号攻击是真实有效的。现在诸如MIUI或Google Now之类的语音识别Speech recognition(SR)系统己经成为越来越流行的人机交互方法,并且已经将各种系统转变为语音可控系统voice controlled system(VCS)。在研究工作中,论文使用语音合成技术和从录音中提取特征的方法来证明被调制过的声音命令是可以被声音识别系统成功解调和理解的。使用在语音识别系统上验证听不见的超声波攻击包括小米、苹果、华为等厂商在内的手机、平板和各种装载麦克风的智能设备。通过一些概念验证攻击,注入一系列听不见的语音命令,包括在iPhone的Siri上开启Face time模式,攻击小米手机使其拨打电话。最后,论文提出了硬件和软件防御解决方案,并建议重新设计语音可控系统,让语音可控系统能识别到人耳听不到的语音命令攻击。