基于张量分析的多因素音频信号建模与应用研究

被引量 : 10次 | 上传用户：minini

【摘要】

：

随着互联网技术和多媒体技术的不断发展,音频信号作为多媒体信号的重要组成部分,对其进行分析和处理引起了越来越多研究人员的关注,而张量分析是近年来被广泛使用的多边或者

【作者】

：

杨立东

【发表日期】

：

2016年01期

【关键词】

：

多因素音频信号张量分解特征建模音频分类数据恢复张量补全

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术和多媒体技术的不断发展,音频信号作为多媒体信号的重要组成部分,对其进行分析和处理引起了越来越多研究人员的关注,而张量分析是近年来被广泛使用的多边或者多线性分析工具,可以处理不止一个影响因素的信号,包括信号的高阶扩展形式或者本身是多维度的信号。本文把张量分析方法引入到多因素音频信号建模及其应用研究领域,利用其作为一种多因素分析方法在处理高阶信号方面可以保持数据结构信息的优势,解决音频信号的高阶特征建模、音频分类的高阶子空间分析和多声道音频信号丢失数据的恢复这三个应用问题,具体研究内容如下:1.针对音频信号的特征建模,本文对传统的一维、二维建模方式进行扩展,使用张量对音频信号的高阶特征建模,既体现了音频信号在不同属性子空间的物理意义,又保证了各子空间之间的联系,而且通过张量分解可以挖掘音频信号潜在的、本质的、具有区分度的结构信息。在无人车语音命令识别系统中构建一个帧结构、分解尺度、特征参数的三阶张量;在音频分类系统中,采用声学特征空间、感知特征空间和心理声学特征空间的不同属性构建三阶张量。通过使用张量建模和分解得到的音频特征集合,有利于提升音频识别和分类的正确率。2.针对音频分类这一模式识别问题,本文利用高阶子空间分析方法,创造性的使用非负张量分解技术进行音频分类。在有监督的音频分类训练时,把音频信号用非负张量模型表示,为了确保分解结果的唯一性,使用非负张量分解对每类音频信号分别进行学习,得到各类音频的非负核张量和因子矩阵;音频分类测试时,通过训练生成的非负因子矩阵把测试音频映射到各种类音频空间,通过Frobenius范数比较映射结果与训练时得到的各类音频核张量的相似度完成音频分类。与传统分类器相比,因为音频数据结构中的非线性关系并没有在非负张量分解过程中受到破坏,所以音频分类效果更好,可以更有效的实现音频数据库的分类标注。3.针对多声道音频信号丢失数据的恢复问题,本文把张量分解和张量补全技术首次引入到音频数据恢复中。张量分解方法是对有数据丢失的音频信号用三阶张量建模并分解,通过加权处理和交替迭代算法实现目标函数最小化;而张量补全方法主要通过定义张量的迹范数,利用凸松弛技术把秩函数最小化问题转化成迹范数最小化问题,即完成非凸优化到凸优化问题的转变,进而解决了非确定性多项式困难问题,利用基于块坐标下降算法的简单补全和基于交替方向乘子算法的精确补全完成多声道音频信号丢失数据的恢复。

其他文献

课堂评价的有效性反思与研究性功能转向——兼谈课堂学习研究对教师专业发展的意义

课堂评价注重量化评价的技术,注重评价目标的多元和丰富,导致了课堂教学评价系统出现“表演课”和“常规课”,完美抽象的应然性评价系统和具体课堂教学很难融合到一起,起不到

期刊

课堂评价发展性教师评价课堂学习研究

跨江大桥深水基础主墩钢套箱围堰工位散拼施工技术

以蚌埠长淮卫淮河大桥工程为分析对象,针对双壁钢围堰制作安装、吸泥下沉、水下封底等方面,详细论述了桥梁深水基础双壁钢围堰工位散拼技术,并就工位散拼的施工要点及其适用

期刊

双壁钢围堰拼装下沉封底施工技术

坚持创新是服装行业发展的必由之路

<正> 江苏省服装行业已有相当大的规模,不少企业的品牌在全国市场上也形成了一定的影响,然而,在目前形势下,江苏服装行业如何继续发展值得探讨。一、2000年全国服装行业发展

期刊

服装行业纺织服装出口服装业

习近平治国理政之新型大国关系

对外战略是习近平治国理政的重要内容,而构建新型大国关系则是习近平对外战略最具鲜明特色的方面。构建新型大国关系符合时代潮流和两国人民的根本利益,具有坚实的现实依据。

期刊

新型大国关系习近平治国理政中美关系

混合动力汽车预测能量管理研究

混合动力汽车技术是解决目前车辆能源消耗过度、空气质量污染和燃油成本过高的有效途径之一。本文以混联式混合动力汽车为研究对象,通过对控制决策在线寻优、未来工况实时预

学位

工况预测交通信息融合能量管理方法混合动力插电式混联式

一种融入个体人格特质的混合图书推荐方法

本文提出了一种融入个体人格特质的个性化图书推荐算法RecUBSPre，该算法基于个体背景因素漂移准确定位目标数据集；并针对图书评分数据的稀疏性，引入用户图书类型偏好矩阵，得出用

期刊

图书推荐人格特质个体背景因素图书类型偏好“大五”人格模型

新兴技术热点领域识别及技术路线图研究

自上世纪中叶,以电子计算机为核心的第三次科技革命全面爆发,这类技术极大的改变了人类固有的生活模式,让社会发展到了一个新的纪元。在这类新技术中,新兴技术的作用尤为突出

学位

新兴技术热点领域技术识别与评价技术路线图技术创新路径

让小水电之花开遍大茅山——江西大茅山垦殖场积极开发水利资源

<正> 江西大茅山垦殖场积极开发水利资源脉中段。这里受亚热带温润气候影响,雨量充沛,林木蓁蓁,涵养了丰富的水源:且山高壑深,溪涧飞泻,水流湍急,蕴含了丰富的水力资源。据勘

期刊

大茅山水电站水利资源垦殖场

贝多芬《第五钢琴协奏曲》中浪漫主义因素探究

古典主义时期以形式为美,追求理性、规整的音乐作品,要求作曲家严格按照规定的形式来进行创作。贝多芬(1770-1827)古典主义的伟大演奏家、作曲家,创作了大量的优秀作品体裁多

学位

贝多芬《第五钢琴协奏曲》古典主义浪漫主义

高职院校创业教育存在的问题及对策研究

就业形势日益严峻的事实使高职生改变传统就业观念,从工作岗位的承担者向工作岗位的创造者转变。因此,高职院校进行创业教育,不仅可以加速经济发展、缓解就业压力,而且可以实

学位

高职院校创业教育经管类专业问题对策

基于张量分析的多因素音频信号建模与应用研究

与本文相关的学术论文