非负矩阵分解算法及在语音转换中的应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:langfenggw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非负矩阵分解(Non-negative Matrix Factorization, NMF)通过将一个非负矩阵分解为非负系数矩阵和非负基矩阵的乘积将数据表达为非负成分的非负线性组合,从而获得数据的子空间表示或者实现数据降维。相比PCA方法,这种非负表达方式更具有物理意义。作为一种有效的数据处理技术,NMF已广泛应用到语音识别、语音转换、人脸检测及识别、文本分析与聚类、网络安全、数字水印、图像处理、生物医学工程等多项领域中。本文的主要研究内容包括稀疏卷积非负矩阵分解算法以及该算法在语音转换中的应用,具体内容如下:(1)提出基于板仓-斋藤距离和稀疏约束的卷积非负矩阵分解算法。与利用已有的基于欧式距离或者KL散度的NMF方法衡量矩阵分解前后的误差不同,本文利用板仓-斋藤距离作为目标代价函数衡量原始矩阵与重建矩阵之间的误差。板仓-斋藤距离函数具有尺度不变性,这使得待分解的矩阵中较小元素具有较小的重建误差。在增加对系数矩阵的稀疏约束后,本文基于此目标代价函数推导了分解算法的乘性更新规则。语音重建实验结果表明通过该方法重建后的语音具有较高可懂度。(2)利用稀疏约束的卷积非负矩阵分解算法进行语音转换。相比普通的非负矩阵分解,稀疏卷积非负矩阵分解能够刻画数据的时延信息,更适合处理语音这类信号。为此,本文利用卷积非负矩阵分解进行语音转换。在训练阶段,利用上述基于板仓-斋藤距离和稀疏约束的卷积非负矩阵分解算法分别得到源说话人和目标说话人的时频基;在转换阶段,首先将待转换语音在源说话人基矩阵上进行非负矩阵分解,然后利用求得的非负系数矩阵和目标说话人基矩阵进行目标语音重建。实验结果表明:该方法可有效地将源说话人语音转换为目标说话人语音,转换后的语音具有较高的可懂度。
其他文献
云计算的概念被提出来的短短几年间,在学术界和工业界的共同推动下取得了巨大的进展。在这个过程中出现了很多的云计算系统,其中Hadoop平台作为一个开源的系统被许多公司采纳。
SOA(Service Oriented Architecture,面向服务的体系架构)是当前用于构建企业IT支撑平台的主流技术;同时,它也是指导信息化建设的一种创新理念,该理念的核心是“面向服务”,“服务
随着观测仪器设备精密程度以及数据收集能力的大幅度提高,光学天文学得到显著发展,我国LAMOST大规模巡天项目获得海量的巡天数据。但是,目前低质量光谱仍占LAMOST观测数据总量的一半左右。这些光谱表现出明显的质量缺陷,如噪声较大、谱线特征不明显、局部信噪比非常低、连续谱异常、拼接异常、减天光异常等。对这些低质量光谱的处理及研究,对于观测产出率的提高、特殊及稀少天体的发现等方面都具有重要的意义。因此
无线传感器网络的节点经常部署在自然环境相对恶劣或是人员较难到达的区域内,如沙漠、水下等,绝大部分应用场景都不具备架设有线供电设施的条件。在现有技术条件下,传感器节
随着网络信息技术的高速发展,Internet上的Web页面数量呈指数增长,如何有效的组织和处理这些海量信息,如何更好地搜索、过滤和管理这些网络资源,成为一个亟待解决的问题。Web
近年来,伪装攻击在计算机安全事件中的比例不断增长,成为对系统破坏最为严重的攻击方式之一.与此同时随着智能手机的普及,用户开始将大量信息存入手机,当手机被不法者窃取时,
在温度测量中虽然有许多不同方法,但热电偶以其独特的优点成为目前工业上温度测量中应用最广泛的传感元件之一,与显示仪表配合可测量气体、液体、固体的温度,也可以作为过程
近年来,随着计算机网络技术的迅猛发展,人们对计算机辅助教育的研究不断深入,其中计算机考试系统的发展备受关注,智能组卷算法作为考试系统的重要组成部分,已成为研究热点。  
命题可满足性问题(SAT问题)是第一个被证明的NP完全问题,是一切NP完全问题的“种子”,任何NP完全问题都可在多项式时间内转化为SAT问题进行求解。当前SAT求解方法在测试向量自
随着社会经济和计算机技术的不断发展,人们对公共安全问题关注度越来越高。现如今,智能视频监控系统已大量应用在医院、大型商场、学校、火车站、汽车站、居民住宅区等公共场