基于非负矩阵分解和向量相似测度的语音与音乐分离算法

来源 :第十一届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:nash86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文针对语音和音乐混叠信号提出一种基于非负矩阵分解(NMF)和向量相似性测度的半盲源分离算法。通过对纯音乐片断进行NMF获得音乐频谱在分解矢量空间的分布(即信号NMF后的基本矩阵),并将其作为先验知识用于混叠信 号NMF分量的分离。采用向量夹角余弦来测量混叠信号NMF分量与训练音乐NMF分量之间的相似性,并根据相似测度对NMF各分量进行语音/音乐属性判定。实验结果表明,相对于基于各类限制条件的NMF分离算法,本算法在信噪比、语音质量听觉评价等指标上都有较显著的改善。
其他文献
随着我国建筑业的不断发展,各种新的施工技术在建筑安装工程中得到了广泛的应用,对提高整个建筑工程质量起到了非常重要的作用.因此,有必要加强对整个建筑安装工程技术的分析
当前,建筑施工行业市场竞争非常激烈,有些房屋建筑企业为了缩短施工周期、降低建设投资而忽略了质量管理和技术监督,造成许多房屋建筑项目不仅质量不符合标准,对居住者的人身
《燕都》杂志创刊于1985年8月,双月刊.北京燕山出版社出版,定价4角5分.累计出版45期,历时7年,1992年12月停刊.rn《燕都》以作者亲历、亲闻、亲见的记述形式,记录了北京的历史
期刊
随着当前社会经济的不断发展,我国食品饮料企业的发展也获得了更好的前景,但是过去的粗放式管理模式并不能够满足企业的全面发展,而且与当前社会经济发展的速度不相匹配.对此
  现有的计算机辅助语言学习系统(Computer Assisted Language Learning,CALL)在得到GOP分数之后,对所有的音素都使用相同的映射函数计算相应的句子得分,忽略了不同音素发音之间
会议
  发音时对声源调音形成口腔发音姿态,调音部位指口腔收紧的部位,主要有舌和上腭。针对当前语音学、汉语普通话教学对调音部位的分区和命名的不一致。本文结合口腔生理结构、
在媒介融合时代,报纸作为传统媒体受到了巨大冲击,新闻报道工作需要创新和发展.本文分析了当今媒体融合时代的具体优势,以及在这种形势下报纸编辑所面临的危机、新闻编辑无法
  在识别系统中,建模单元能够勾画一种语言的声学和语音学特性,因此对系统性能起到至关重要的作用。本研究参照一些已在大词汇量连续语音识别系统(LVCSR)中取得较好效果的建模
  本研究提出了一种基于二元背景模型的新词发现方法。采用前、背景语料二元似然比挑选候选二元组(bigram);然后根据频率、刚性、条件概率等基于前景语料的统计量,对二元组进行
  对声纹识别(说话人识别)等与语音相关的技术进行研究时,需要大量的语音数据,以保证研究的可靠性与有 效性。可以说语音数据库是语音研究的基础和对象。近年来正是由于标准语