频域语音盲分离的模糊性消除方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:lijun1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号分离在语音识别、计算机听觉等方面具有重大的研究意义,已经成为学术研究的焦点。盲源分离(Blind Source Separation, BSS)是指在只知道观测信号而源信号与传输信道参数均未知的前提下,估计出源信号。由于对先验知识要求低,BSS已成为语音信号分离的一种主要方法。混合语音的实际模型大多情况下是卷积混合模型。针对该模型,频域BSS方法在进行分离时,将时域的卷积运算转换成频域的乘法运算,计算量小,速度快,因此已成为解卷积混合的主流方法。但是,BSS固有的幅度模糊性和顺序模糊性对频域方法有很大的影响,特别是顺序模糊性的影响最为严重。如果不能很好地解决频域算法中存在的模糊性问题,语音分离性能将受到很大影响,甚至导致分离的彻底失败。为了更好地消除卷积语音盲分离频域算法中的模糊性,本文重点做了以下三个方面的工作:(1)研究了最小失真法与分离矩阵归一化法等两种幅度模糊性消除方法的原理,通过仿真实验比较这两种方法对JADE、KM-F和CMN等BSS算法幅度模糊性消除的有效性,验证了最小失真法能够更有效的消除幅度模糊性;(2)比较分析了基于源信号不同先验信息的两种距离函数,研究了对频域盲分离顺序模糊性消除的半盲BSS算法,并通过仿真实验,验证了基于能量信息距离函数的半盲算法可以更有效地消除顺序模糊性,并且分离后再排序的全盲BSS算法性能相比,半盲BSS算法的性能更优;(3)通过研究几种典型的概率密度分布与语音信号在不同频率段的分布特性,提出了分频段独立向量分析(Independent Vector Analysis,IVA)算法,使其在不同频率段采用不同的分布模型,进而更好地解决了顺序模糊性问题。大量的仿真实验与实际语音分离实验结果表明,分频段IVA算法比原始IVA算法在顺序模糊性消除上更为有效。
其他文献
在中国分布的鲚属鱼类有四种,分别是短颌鲚、七丝鲚、凤鲚、刀鲚。凤鲚约每年4月下旬开始自近岸浅海溯江进行繁殖洄游,其在长江口鱼汛最大,是目前长江口能形成鱼汛的几种经济类
公司财务表现与环境表现之间的联系日益明显.各公司可以通过促进后者而力求获得资助优势.公司环境表现对金融利害攸关者的价值随资助类型而异,同样也随环境改善的程度和具体
本文通过对荣华二采区10
期刊
胚胎干细胞(embryonic stem cells,ESC)是从植入前的胚胎内细胞团(Inner mass cells,ICM)或原始生殖细胞(Primordial germ cells,PGCs)分离和克隆的具有多潜能性细胞。胚胎干
bkdF基因和nsdA基因是在阿维链霉菌(Streptomycesavermitilis)基因组中发现的两个与阿维链霉菌次生代谢和分化发育密切相关的基因。bkdF的基因产物作为支链α酮酸脱氢酶(bran
ZnS是一种重要的宽禁带直接带隙Ⅱ-Ⅵ族半导体材料,具有优良光电性能,因此在紫外激光器,光电探测器和太阳能电池等领域有着非常广泛的应用。本文采用热蒸发的方法对ZnS一维纳米
本文考察了劳埃德(Lloyds),即金融机构举措的早期签字者之一,如何开展其与该联合国环境规划署声明一致的环境管理实践,和金融机构如何受益于成为该举措的成员.自从该声明推出
在微波技术研究中,微波功率是表征微波信号特征的一个重要参数。微波功率的检测在微波发射机/接收机的功率水平的监视、增益控制、电路保护、交通控制、手提式设备以及军事领
水稻(Oryza sativa)是最重要的粮食作物之一。随着水稻全基因组序列的测定,以解析水稻全部基因功能为目标的功能基因组研究已成为水稻基因组学研究的重点。大型突变体库是水稻功
在航天领域,压缩是解决海量数据给有限信道带宽带来压力的主要措施之一,遥感图像因其获取代价很高所以特别珍贵,也给压缩技术带来了巨大的挑战,如何能即提高压缩比,又能保证还原后