论文部分内容阅读
作为计算机科学和管理科学领域一个重要的研究课题,NP-难问题通常复杂度很高、求解比较困难,这一领域的研究工作在模型优化、数据分析和管理决策等领域具有重要的研究及应用价值。稀疏表达(稀疏分解,压缩感知)是一种由训练数据驱动的数据分析方法,它的求解是一个典型的多维NP-难问题,它对数据标注质量不敏感,可以将数据样本分解为通用成分字典与系数向量的乘积,从而实现对混合数据所有主要成分的解析;然而现有稀疏建模算法常用的稀疏约束不够精密,在数据分析领域也缺乏有效的数据复杂度特征定义方法,需要进行针对性改进以满足混合源数据分析的需求。混合乐器音乐数据是一类典型的音频时变数据,具有许多与其他随时间变化的数据相似的特性。然而,混合成分音乐数据分析存在数据标注困难、次要成分分析困难、方法可解释性和直观性差等问题,类似的情况也存在于其他混合时变数据中,需要进行针对性处理才能获取更精密、更深层次的分析结果,以应用于公共场所声音管理、音乐数据分析管理和其他数据分析领域。为了解决这些问题,本文研究工作将对稀疏表达算法采用的稀疏约束和求解算法展开研究,对以混合音乐数据为代表的混合成分时变数据进行分析和处理,并给出一套面向这类数据的特征定义方法和分析方法、通过新的求解范式提升稀疏表达和其他NP-难问题相关算法的求解精度。主要工作如下:(1)在对稀疏建模算法和混合音乐数据分析问题进行深入分析研究的基础上,给出一个用于数据复杂度分析和稀疏表示算法优化的稀疏复杂度特征指标SPI(Sparse Performance Index),分析其取值范围、期望值、连续性、可导性和物理意义等各种特性,在理论上证明它作为稀疏复杂度度量特征的合理性和可靠性。使用混合音乐数据和其他类别时变数据验证SPI指标的数据分析性能。(2)在SPI稀疏复杂度特征指标和K-SVD稀疏字典学习、OMP回归分析算法基础上,提出基于多维成分字典的混合音乐数据分析方法,介绍该方法的参数设置和计算流程,结合实际应用需求介绍其可解释性、非主要成分敏感性、通用性和可扩展性等方面的优势。在弦乐四重奏和小提琴&钢琴奏鸣曲等典型混合音乐数据上测试方法的性能,给出充分的实验结果。(3)针对现有稀疏建模算法和理论范式存在的问题,提出基于SPI的稀疏建模理论范式和求解方法,探讨该范式的收敛域和求解过程中的优势,提升稀疏表达这一典型NPH问题的求解精度、扩展求解和优化的技术手段。在包括模拟时变数据的多种数据集上测试所提出的建模范式的收敛情况,以及实际优化建模的效果。