基于张量分析的多因素音频信号建模与应用研究

被引量 : 10次 | 上传用户:minini
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和多媒体技术的不断发展,音频信号作为多媒体信号的重要组成部分,对其进行分析和处理引起了越来越多研究人员的关注,而张量分析是近年来被广泛使用的多边或者多线性分析工具,可以处理不止一个影响因素的信号,包括信号的高阶扩展形式或者本身是多维度的信号。本文把张量分析方法引入到多因素音频信号建模及其应用研究领域,利用其作为一种多因素分析方法在处理高阶信号方面可以保持数据结构信息的优势,解决音频信号的高阶特征建模、音频分类的高阶子空间分析和多声道音频信号丢失数据的恢复这三个应用问题,具体研究内容如下:1.针对音频信号的特征建模,本文对传统的一维、二维建模方式进行扩展,使用张量对音频信号的高阶特征建模,既体现了音频信号在不同属性子空间的物理意义,又保证了各子空间之间的联系,而且通过张量分解可以挖掘音频信号潜在的、本质的、具有区分度的结构信息。在无人车语音命令识别系统中构建一个帧结构、分解尺度、特征参数的三阶张量;在音频分类系统中,采用声学特征空间、感知特征空间和心理声学特征空间的不同属性构建三阶张量。通过使用张量建模和分解得到的音频特征集合,有利于提升音频识别和分类的正确率。2.针对音频分类这一模式识别问题,本文利用高阶子空间分析方法,创造性的使用非负张量分解技术进行音频分类。在有监督的音频分类训练时,把音频信号用非负张量模型表示,为了确保分解结果的唯一性,使用非负张量分解对每类音频信号分别进行学习,得到各类音频的非负核张量和因子矩阵;音频分类测试时,通过训练生成的非负因子矩阵把测试音频映射到各种类音频空间,通过Frobenius范数比较映射结果与训练时得到的各类音频核张量的相似度完成音频分类。与传统分类器相比,因为音频数据结构中的非线性关系并没有在非负张量分解过程中受到破坏,所以音频分类效果更好,可以更有效的实现音频数据库的分类标注。3.针对多声道音频信号丢失数据的恢复问题,本文把张量分解和张量补全技术首次引入到音频数据恢复中。张量分解方法是对有数据丢失的音频信号用三阶张量建模并分解,通过加权处理和交替迭代算法实现目标函数最小化;而张量补全方法主要通过定义张量的迹范数,利用凸松弛技术把秩函数最小化问题转化成迹范数最小化问题,即完成非凸优化到凸优化问题的转变,进而解决了非确定性多项式困难问题,利用基于块坐标下降算法的简单补全和基于交替方向乘子算法的精确补全完成多声道音频信号丢失数据的恢复。
其他文献
课堂评价注重量化评价的技术,注重评价目标的多元和丰富,导致了课堂教学评价系统出现“表演课”和“常规课”,完美抽象的应然性评价系统和具体课堂教学很难融合到一起,起不到
以蚌埠长淮卫淮河大桥工程为分析对象,针对双壁钢围堰制作安装、吸泥下沉、水下封底等方面,详细论述了桥梁深水基础双壁钢围堰工位散拼技术,并就工位散拼的施工要点及其适用
<正> 江苏省服装行业已有相当大的规模,不少企业的品牌在全国市场上也形成了一定的影响,然而,在目前形势下,江苏服装行业如何继续发展值得探讨。 一、2000年全国服装行业发展
对外战略是习近平治国理政的重要内容,而构建新型大国关系则是习近平对外战略最具鲜明特色的方面。构建新型大国关系符合时代潮流和两国人民的根本利益,具有坚实的现实依据。
混合动力汽车技术是解决目前车辆能源消耗过度、空气质量污染和燃油成本过高的有效途径之一。本文以混联式混合动力汽车为研究对象,通过对控制决策在线寻优、未来工况实时预
本文提出了一种融入个体人格特质的个性化图书推荐算法RecUBSPre,该算法基于个体背景因素漂移准确定位目标数据集;并针对图书评分数据的稀疏性,引入用户图书类型偏好矩阵,得出用
自上世纪中叶,以电子计算机为核心的第三次科技革命全面爆发,这类技术极大的改变了人类固有的生活模式,让社会发展到了一个新的纪元。在这类新技术中,新兴技术的作用尤为突出
<正> 江西大茅山垦殖场积极开发水利资源脉中段。这里受亚热带温润气候影响,雨量充沛,林木蓁蓁,涵养了丰富的水源:且山高壑深,溪涧飞泻,水流湍急,蕴含了丰富的水力资源。据勘
古典主义时期以形式为美,追求理性、规整的音乐作品,要求作曲家严格按照规定的形式来进行创作。贝多芬(1770-1827)古典主义的伟大演奏家、作曲家,创作了大量的优秀作品体裁多
就业形势日益严峻的事实使高职生改变传统就业观念,从工作岗位的承担者向工作岗位的创造者转变。因此,高职院校进行创业教育,不仅可以加速经济发展、缓解就业压力,而且可以实