音频分类相关论文
音频分类问题一直是研究的热点和难点,解决这个难点的一个有效的方法就是卷积神经网络,但是大多数优秀的卷积神经网络都是应用于图......
梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)是一种符合人耳听觉特征,并与频率呈非线性对应关系的频谱特征,广泛应用......
物联网的音频技术正处在飞速发展时期,它也渐渐开始改变人们的生活习惯和生存方式,如何更好地对现有的大量音频数据资源进行分类是......
音频场景分类是对音频数据的识别和分类,即识别判断所记录声音的环境标签,可以应用于音频监控、异常发现和风险防控等多种安防监听......
音频是信息的重要载体,针对音频信号处理的研究具有广泛的应用价值。深度学习方法能够自动从海量数据中高效的提取任务相关特征,在......
随着互联网在全球的普及和5G网络在中国大范围的建设,更全面的网络覆盖使得网络活动更便捷的同时也带来更大信息泄露的风险。投机......
本文根据当前江苏广播广告的类型和播出流程,针对广告播后检测的需求设计了一个基于人工智能的广告自台监播系统,系统基于音频声纹......
音频信号处理在家庭活动识别、监控系统等领域变得越来越重要。目前大部分音频信号处理问题都使用深度学习方法。深度学习方法中最......
支持向量机是上世纪九十年代提出的一种基于小样本的新的统计学习方法。本论文通过引入一种新的基于支持向量机的多类分类方法来解......
随着计算机技术、网络技术和通讯技术的不断发展,图像、视频、音频等多媒体数据已逐渐成为信息处理领域中主要的信息媒体形式,其中......
本文在对声音信号采集、特征提取以及场景分类技术等理论全面分析的基础上,提出了一系列新的时域特征提取方法如帧内平均峰值能量......
本文是针对电视节目中的音频信号进行的音频分割分类方法的研究.在对现有算法的充分研究和实验的基础上,实现了电视音频的分割分类......
视频、图像和音频等多媒体数据已经成为信息处理领域的主要信息媒体,其中音频占有很重要地地位。传统的基于文本的检索存在主观性和......
近年来,随着数字音乐创作、收集以及存储技术的快速发展,许多机构积累了大量的音乐音频数据。随着英特网多媒体资料的蓬勃发展,如......
随着信息技术的快速发展,音频正以不同的数据类型融入到当今的计算机网络中。其中,对音频信号识别、分类的相关研究产生了一系列智......
随着多媒体和互联网技术的不断进步与发展,音频信号作为多媒体信号的重要组成成分,对其进行信息处理与挖掘受到越来越多研究者的青......
音频分类(audio classification)是计算机听觉相关研究的主要方向之一,需要根据声音的内在特点对不同声源进行分类。随着深度学习......
随着计算机网络和多媒体技术的迅猛发展,数字视频在人们的生活中成为不可或缺的信息载体。但是在这些视频中,还夹杂着一些不良内容......
音频处理在多媒体信息处理中占有重要地位。原始音频数据是一种非语义符号表示和非结构化的二进制流,如何提取音频中的结构化信息和......
本论文研究了压缩音频处理及应用的重要课题,通过对压缩音频处理的研究目的、研究意义和主要方法进行讨论,对国内外研究现状进行综述......
音频处理在多媒体信息处理中占有重要地位。原始音频数据是一种非语义符号表示和非结构化的二进制流,如何提取音频中的内容语义和......
提出了一种把音频片段分类成语音或音乐的新系统.系统能自动选取在相应的信噪比下具有最高分类精度的特征参数.将从音频片段提取的......
为了缓解广场舞大妈与附近居民的矛盾,本文利用平方余数序列扩散体,采用复合再生木吸声材料,设计了一种彩灯声屏障,该彩灯声屏障既......
采用同一种特征参数--Mel倒谱系数及其动态参数区分纯语音、带背景语音、乐器音、歌声和环境音.根据该特征参数的特点以及各类音频......
水声目标识别的任务是通过采集到水声目标的信号来对目标进行分类,在海洋勘探,监听技术等领域有着非常重要和广泛的应用.由于海洋......
为解决单一语音、音乐音频及其两者的混合音频进行语音/音乐分类时分类结果不准确的问题,提出一种基于音频分割的音频分类算法。利......
海洋声场环境的时变空变特性、水声目标发声机理的多源性以及其他噪声源的干扰,给水声目标的检测和识别带来很多困难.常规的目标识......
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且不支持实时音频检索.为此,基于内容的音频检索技术应运而生.文中根......
音频是一种重要的媒体,它包含丰富的听觉特征。根据基于内容的音频检索的研究现状,本文总结出基于内容音频检索系统的概念,给出音频检......
因为音频媒体的特征维数较高,导致音频处理的计算量大.本文提出一种基于变精度粗糙集模型(VPRSM)的音频分类方法。先提取音频特征,构造V......
音频分类在基于内容的音频、视频检索和分析中起着重要作用。文章针对静音、语音、音乐和环境背景音4类音频提出基于VQ-GMM的分类......
熟料的质量对氧化铝生产至关重要。根据熟料下落声音来判断熟料的烧结程度和窑壁是否有脱落在实际生产中有着较好的效果。但该方法......
随着多媒体和Internet技术的广泛应用和深入普及,多媒体数据的数量正在飞速增长,音频数据作为多媒体数据的重要组成部分,其信息量......
提出一种基于向量空间模型(VSM)的音频分类算法.特征提取中,针对目前采用的参数主要为静态特征,提出了基于信息论的动态特征计算方......
按照MEPG-7的音频特征规范,设计了帧层次和段层次上的音频特征提取算法.在深入分析足球比赛中各类音频信息的不同特点的基础上,通......
提出一种利用Tucker分解获得鲁棒性较强的音频信号不同属性的特征,在高斯混合模型上测试音频信号分类性能的方法。音频信号经过预处......
本文设计与实现了一个全自动中文新闻字幕生成系统,输入为新闻视频,输出为视频对应的字幕文本.以《新闻联播》为语料,实现了音频提......
很多传统的音频流分割方法都是基于小尺度音频分类的,它们普遍存在虚假分割点过多的缺点,严重影响了实际应用的效果.我们的研究表......
基于内容的音频流分割是多媒体数据分析领域中的一个十分重要和困难的问题.目前大多数传统的音频流分割方法是基于小尺度音频分类的......
【摘要】搜索和组织发展的数字音频收藏需要音频的自动分类。本文建立基于第二代小波变换和二阶非齐次隐马尔可夫(OSGWT-SNHMM)模型......
为施行有效的音频分类以高效率处理日渐复杂的音频信息,研究采用包含多种神经网络在内的5种机器学习模型,实现多种决策下的音频分......
该文提出一种音频情感区间划分方法。该方法以提取音频情感语义方面为目的,可以有效地划分出视频流中音频通道的情感区间。首先,事......
根据不同的应用背景和分类对象,分别概述了多媒体数据库中基于内容的音频分类的一些关键技术,如特征提取和分类器设计,并分析了各......
针对广场等区域人流量大、安保要求高的特点,设计并实现了一套基于音视频识别的区域安防管控平台。该平台从区域安防的需求出发,设......
基于统计学习的音频分类具有理论基础坚实,实现机制简单等特点受到广泛关注并被很多音频分类系统所采用。本文对核Logistic回归算法......
随着多媒体信息的日益增多,如何对具有海量信息的多媒体数据进行有效的检索成为人们关注的问题.其中,音频信号检索技术成为热点研......
为了解决基于内容的音频检索、语音文档检索等很多领域中提取音频结构和内容语义的问题时,介绍几种比较典型的音频分类算法包括最......