基于麦克风阵列的盲语音分离算法研究

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:bvf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
盲源分离是近几年信号处理领域兴起的热点问题,其主要目的是在未知源信号以及传输特性的前提下,仅从接收的混合信号中提取或表达出独立源信号的信息。近几年的研究表明,真实环境中的盲语音分离是非常困难的,环境噪声、复杂的房间冲激响应都会使仿真环境下工作很好的盲分离算法性能大大下降。该论文在此背景下开展基于麦克风阵列的盲语音分离算法研究。 该论文的主要工作如下: 1.针对卷积混合的盲分离模型,该文提出了一种快速的频域内盲语音分离方法,通过预处理(如解相关),基于信息最大化的独立分量分析滤波和后处理(解排列和尺度不定性)等一系列算法步骤,达到有效地分离卷积混迭的语音信号的目的;尤其是引入一种改进的数据白化算法,能够很好地去除各分量中的二阶相关,提高了独立分量分析算法的收敛速度,对低混响条件(混响时间小于100ms)下的真实混合语音信号,获得非常好的分离效果; 2.针对在真实会议厅(混响时间在800ms左右)频域盲语音分离算法性能下降的问题,该文提出了一种改进的实时盲语音分离方法,通过延时-相加的多波束形成器和功率谱减法的预处理算法,对混响和噪声有一定的抑制作用,以及采用改进的批处理算法,因此它非常适合于在实际的麦克风阵列盲语音分离系统中实时实现; 3.设计并实现了一种基于USB2.0接口的麦克风阵列实时采集系统,通过FPGA实时地采集并打包多通道的语音数据,由DMA通道交给USB2.0控制芯片,再由USB2.0的等时传输(isochronous)端点把语音数据传送给上位PC机,实时同步获取信噪比高的麦克风阵列语音数据,完成了实时盲语音分离算法的性能评估实验。该系统的USB2.0带宽最大达到了192Mbit/s(在等时传输模式下)的理论值,提供了很好的系统扩展性。
其他文献
α-半乳糖苷酶(α-Galactosidase,EC3.2.1.22),也称蜜二糖酶,是一类能够催化水解末端含α-1,6-半乳糖苷键的酶类,包括线形和分支寡糖,多糖以及人工合成的底物,如蜜二糖、棉子糖、水
本文是在上述“科技部子项目”背景下,在分析总结现有研究成果的基础上,以科技部子项目需求为基础,针对十一种元数据标准的特点以及系统可扩展性和元数据互操作性等要求,兼顾图书
传统的基于MAP的语言模型自适应技术虽然在解决训练语料的数据稀疏问题上取得了很大的成功,然而该方法的前提是要求有一定量的主题相关自适应语料,然而在某些语音识别应用中,
针对数据仓库中多维数据的联机分析处理和数据挖掘一直是国内外的研究热点,它在企业决策支持中具有广泛的应用前景和巨大的应用价值。联机分析处理虽提供了多角度多粒度展现数
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
学位
当前XML已经成为Internet上各类应用系统之间数据表示和交换的标准,越来越多的关系数据库应用系统采用XML作为标准格式来发布和交换数据,研究关系数据和XML数据之间的转换方法,
本文是“H.264图像编解码器SOC芯片”项目的子项目“基于DM642的H.264编码器的设计和实现”。本文应用于视频监控系统,主要任务是在基于TITMS320DM642数字媒体处理器的硬件平
近些年来,随着互联网,移动网络及计算能力的高速发展,越来越多的,包括手机,平板电脑,智能电视在内的人机交互设备呈现爆炸式的增长。语音信号作为人机交互的媒介,受到了越来越多的关
家庭网络核心芯片是家庭局域网的硬件基础。为了设计拥有自主知识产权的家庭网络核心芯片,首先需要在电路板级验证系统方案的正确性。本论文结合无线通信系统的基本原理和国家