面向智能汽车应用的语音盲分离实验研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:qiuzhilv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着物联网和人工智能技术的兴起,基于语音识别的人机交互方式受到越来越多的关注。然而,智能设备在获取语音指令时容易受到干扰信号以及环境噪声的影响,进而影响指令的识别效率。同时,目前多数语音识别系统在同一时刻只能识别单条语音指令,对于多目标同时发出指令的情况则无法做出正确响应。本文对实际环境下混合语音信号的分离问题进行了研究和测试。首先,分析了麦克风阵列和盲源分离技术的理论基础,确定了相关技术在本设计中的可行性。然后,设计并实现了音频采集传输硬件系统。使用8阵元、阵元间距5cm的均匀线性麦克风阵列作为信号采集前端,基于FPGA对各阵元同步进行驱动、信号采集和解码运算,并使用Wi Fi模块将数据流透传到上位机供进一步处理。测试结果表明,本硬件系统能实现所需功能,并具备一定的扩展性。随后,本文引入了针对卷积混合模型的独立向量分析算法,即先将信号变换到复频域,然后把所有频率成分看作一个多维向量进行整体迭代和分离,以此克服了独立成分分析所固有的排序不确定问题,再将信号反变换回时域得到输出结果。最后,我们在车载环境中采集多路混合音频信号,并进行分离运算。实验结果和误差分析表明:在实际环境中,本系统能实现5路信号的分离,并保证较好的信号质量。而当目标声源数更少时,分离信号的质量也更高。本文实现了实际环境中音频信号的采集和分离,具有一定的实用意义。
其他文献
嵌入式Flash由于成本、存储密度等优势日益成为微控制器中重要的程序、数据存储器。然而嵌入式Flash相对较慢的读取速度,制约着微控制器的整体性能,因而提升Flash中指令和数据的读取性能十分重要。当前研究主要采用缓存和预取技术对Flash进行读取加速,但是仍存在两个问题:1)缓存的行大小是固定的,不利于适配各种应用程序;2)当前预取技术主要是顺序预取,准确率相对较低。因此如何进一步优化缓存和预取
分组密码算法是密码学当中一个重要的领域,它被广泛地应用于智能卡,U盾等商用设备中,以保证攻击者无法窃取到其中的私密信息。随着分组密码设计方案的不断完善,目前广泛使用的诸如高级加密标准(Advanced Encryption Standard,AES),PRESENT等常见密码算法都有着极高的理论安全性能,传统的密码学分析方法很难对这些算法产生实质性的威胁。然而,理论上的安全并不代表着实际上的安全。
随着网络通信技术的快速发展,以及智能移动终端的普及,基于位置信息的服务在室外场景中为人们提供便利,已经完美融入人类的日常生活。但是在室内场景的消费者领域,如地下停车场寻车、消防员对被困人员的快速定位、大型交通枢纽寻人等场景,受限于室内定位技术的发展,基于位置信息的服务迟迟无法开展。为了解决室内定位的困境,需要一种可用于智能移动终端的高精度室内定位系统。本文从定位精度、有效范围以及成本等方面进行研究
云计算、数据中心和高性能计算带宽的快速增长,促使高速线缆和高速连接器必须降低其信号衰减,进一步发展以满足更快的传输速率,更宽的带宽和更高用频的需求。对高速互连相关技术的发展必须借助仿真工具进行。本论文的主要工作内容总结如下:(1)介绍了经典多传输线模型、以及针对差分系统的混合模S参数,根据混合模式特点分析高速线缆建模要点,对实际线缆进行简化。(2)针对线缆测量的实际环境,界定线缆外的复杂结构对共模
随着无线通信技术的不断发展,人们对于信息的传输速率有了越来越高的要求。6G通信作为未来新一代无线通信技术,在传输速率、网络延迟等方面将有更高目标,正受到越来越多的关注,也面临着严峻的技术挑战。毫米波传输是6G通信非常有潜力的方式,而多天线的大规模MIMO系统作为毫米波传输的核心技术之一,其传输频率高、天线阵元数量多等特点,对信号的功率利用率提出了更高的要求。从这个角度来看,高功率效率物理层设计的重
在当今的高速有线通信中,以SerDes为基础的串行传输方式成为研究的热门。SerDes是串行器(Serializer)和解串器(Deserializer)的缩略词,意在将多路并行的低速数据合并成一路串行高速数据发送,再在接收端接收后将数据恢复成多路并行的低速数据。正如无线通信系统那样需要产生本振时钟来完成信号的调制、解调,在SerDes有线链路中,同样需要有时钟模块产生“本振信号”来配合系统接收端
随着无线通信技术的不断发展,移动通信对带宽和速率的需求也在不断地增长。然而由于中低频段无线电已经趋于饱和,必须开发新的频谱资源以实现高速、高带宽的可靠通信。因此,鉴于毫米波频段仍有许多未开发的可用频谱资源,毫米波通信被列为5G系统的关键技术之一。为获得毫米波系统的全部增益,需要对毫米波大规模天线系统进行波束成形设计。然而由于传统的全数字波束成形架构需要配备大量的射频链路而导致其极高的硬件成本和能耗
随着社会经济的发展,我国汽车保有量迅速增加。在此背景下,做好车辆检测与修理工作对于保障汽车行驶安全有着重要意义。在车辆检修企业的传统作业流程中,检修结果以手工填写纸质表的方式来记录,存在检修效率低、检修成本高、检修结果不易保存等问题。通过引入语音识别技术,将检修工人发出的语音转换为文字检修结果后,利用信息化系统进行管理,可实现车辆检修流程的无纸化,从而解决以上问题。因此,研发一款基于语音识别的车辆
工业控制、医疗装备、汽车电子等领域有大量的嵌入式系统需求,随着实时传感器数据融合、信号大数据在线处理等需求的提高,嵌入式系统架构需要具备更强的实时流处理与数据传输能力。同构的嵌入式CPU、DSP架构往往难以满足复杂流数据处理场景的需求,基于FPGA与CPU结合的异构架构,能够发挥其可灵活定制的优势实现高并发的预处理和复杂数据传输,同时具有功耗低、扩展性好等特点。面向高性能嵌入式信号处理系统需求,本
纳税人"获得感"问题是财税领域近几年关注的热点。文章从理论上构建了税收期望差模型,并将此模型应用于近期的税收热点问题,为纳税人"获得感"差、个税改革、"放管服"改革等提供理论解释。研究发现,税收期望差包括不合理期望差、税收征管期望差和部分税收政策期望差。不合理期望差和税收征管期望差属于主观性的局限性期望差,可以通过宣传教育和提升征税人的努力程度来降低或消除,而税收政策期望差和另一部分税收征管期望差