广播语音的分割与分类研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:rsilent
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今的大词汇量的语音识别系统,在安静的实验室语音情况下已经获得了很高的识别率。但是,想要把语音识别推入到更加广阔的应用空间中区,需要对系统的鲁棒性,计算速度上提出了更高的要求。广播语音,作为一种实际语音,有其复杂性,和一般的实验室语音有一定的区别,比如:广播语音包含各种音频要素,比如人声,音乐,长的静音段,噪音等。如何提取音频中的结构化信息和音频内容,是音频信息深度处理,基于内容检索和提高系统鲁棒性的基础。目前对于广播语音的分割与分类研究是当前的研究热点之一。本文主要研究了语音和音乐之间的区别,通过抽取特定的特征搭建了一个基于支撑向量机的语音、音乐的区分系统,完成语音、音乐两种最主要的音频要素的分类。另外,本文就一种最常见的特征基音频率进行了一定的研究,并将之用于区分语音、音乐的系统中去,完成了一些实验。除此之外,本文总结了当前国际上主要的音频分割的方法。使用其中贝叶斯信息准则应用到以距离为基础的检测法,搭建了一个说话人跳变点的区分系统。本文的工作为完整的语音分割系统的搭建打下了一定的基础,对进一步的深入研究具有一定推动和借鉴意义。
其他文献
姬乃甫,男,汉族,我国著名新闻工作者,书法家,新华社高级编辑,陕西省米脂县姬家石沟村人。1964年本科毕业后到新华社国内部工作,曾任国内部副主任,同时兼任《中国质量万里行》杂志社副社长。1995年出任《新华每日电讯》报党组书记、总编辑,现兼任首都新闻工作者书法家联谊会副会长、中国硬笔书法家协会会员、中国书画家联谊会会员。    上个世纪90年代,我临时办过两份世界体育大赛的快报,一份是《奥运快报》
在C5石油树脂的生产过程中,粘度是一个重要的控制参数,如果能实现粘度的在线连续检测,就可以根据它与分子量的模型关系,清楚地了解反应的进程,从而较好地控制产品质量。但目
本刊讯:在改革开放30年之际,新闻出版总署党组书记、署长柳斌杰调强指出,新闻出版改革今年要有大突破,政府将进一步完善宏观环境,加大对改革的支持力度和推动力度,全行业必须
导入TRXS基因后,转基因大麦籽粒的硫氧还蛋白H活性明显提高;淀粉酶活性也明显提高,其中Α-淀粉酶活性在开花后30D提高了3倍以上,随着籽粒的发育,转基因对Α-淀粉酶活性影响作
随着电力系统信息技术的发展,数字化变电站越来越受到人们的关注。数字化变电站是由智能化一次设备(电子式互感器、智能化开关等)和网络化二次设备分层(过程层、间隔层、站控
随着集成电路进入深亚微米时代,功耗问题已成为超大规模集成电路设计考虑的重要因素。本文以嵌入式RISC(Reduced Instruction Set Computer)处理器为平台,针对逻辑电路各个层次低
视觉目标跟踪技术是计算机视觉、图像处理和模式识别领域里一个非常活跃的课题,目前,基于DSP的嵌入式视频跟踪系统已经成为人们研究的重点。 TI公司的TMS320DM642(简称DM642
税控后台及房地产税控发票开具软件是基于Windows平台的税控收款机和税控器推广、应用的上位机认证管理系统,是用于税务机关收集和管理税控装置信息的税控管理平台。税控装置
This paper addresses the adaptive tracking control scheme for switched nonlinear systems with unknown control gain sign. The approach relaxes the hypothesis tha
低阶煤热解和气化后会产生热解半焦和气化残炭等超低挥发分碳基燃料,为解决超低挥发分碳基燃料着火稳燃难、燃尽难和污染物排放水平高等问题,在35 t/h工业煤粉锅炉上增加了预