基于高层信息特征的重叠语音检测

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户：q115106962

【摘要】

：

重叠语音是影响说话人分割性能的主要因素之一。该文提出了基于语音高层信息特征的重叠语音检测方法以提高说话人分割效果。首先用通用背景模型(universal background model,

【作者】

：

马勇鲍长春

【机构】

：

北京工业大学电子信息与控制工程学院,江苏师范大学物理与电子工程学院,

【出处】

：

清华大学学报(自然科学版)

【发表日期】

：

2017年01期

【关键词】

：

重叠语音检测高层信息特征说话人分割

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

重叠语音是影响说话人分割性能的主要因素之一。该文提出了基于语音高层信息特征的重叠语音检测方法以提高说话人分割效果。首先用通用背景模型(universal background model,UBM)提取语音的语言学高层信息特征,并融合这些特征和Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征建立隐Markov模型(hidden Markov model,HMM)检测重叠语音,然后对处理后的语音进行说话人分割。实验结果表明:对于由TIMIT语音库生成的数据集,该方法对重叠语音检测的错误率比单一采用MFCC特征有显著降低,而且说话人分割性能有明显的提高。 Overlapping speech is one of the main factors that affect speaker segmentation performance. This paper proposes an overlapping speech detection method based on the features of speech high-level information to improve the speaker segmentation. At first, we use the universal background model (UBM) to extract the linguistic high-level information features of speech and fuse these features with the Mel frequency cepstral coefficient (MFCC) to build the hidden Markov model (HMM ) Detects overlapping voices and then performs speaker segmentation on the processed voices. The experimental results show that the error rate of overlapping speech detection for the data set generated by the TIMIT speech library is significantly lower than that of the single MFCC feature, and the speaker segmentation performance is obviously improved.

其他文献

W波段单刀双掷开关的设计与仿真

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

毫米波单刀双掷开关二极管

联结:设计“学习单”的核心要素

学习单的使用,能有效地把“教”为中心的课堂改变为“学”为中心的学堂;但一张有效的学习单不应是孤立的、被割裂的。它应生成于学生的学情,着眼于文章的文体,构建好内在的逻

期刊

语文学习单设计联结

中国新能源汽车换电模式发展问题研究

随着新能源汽车补贴退坡,换电模式的经济性和便利性逐渐凸显,日益受到行业重视,但发展换电模式仍需解决标准、政策和管理体系等诸多问题.文章重点研究了我国换电模式的发展现

期刊

新能源汽车换电模式问题建议

高中生物教学中支架与建模教学法的融合应用

将支架式教学法融入高中生物建模教学过程,可以降低学生进行建模学习的难度,促进深入理解建模内容与建模思维,建构内化的知识体系,最终提升学生科学思维、科学探究能力和解决

期刊

支架式教学法建模教学高中生物课堂

局灶性癫痫功能磁共振的语言重组与网络连接研究

目的：探讨局灶性癫痫患者的语言任务模式fMRI脑激活图，fMRI语言网络连接，分析语言功能与fMRI语言网络连接的联系。方法：选择18例符合诊断标准的局灶性癫痫患者（癫痫组）及18例健康志

期刊

癫痫词语阅读任务功能磁共振网络连接

在会展场馆中如何选用工业连接器的研究

为符合在会展场馆中的环境和安装要求，工业连接器在安装需要考虑的因素有：灰尘、潮湿、高低温、撞击等等；而且在会展场馆中使用的工业连接器和组合装置，还需要符合国际标准，满足最

期刊

会展场馆连接器插头插座电源

一种冗余度机器人灵活性优化算法

本文对冗余度机器人的运动灵活性的优化问题进行了研究。首先介绍了一种利用梯度投影思想的优化算法，指出了该算法在实际应用中一些局限性。进而提出一种比例调节矢量优化算法

期刊

区度比椭球冗余度机器人比例调节矢量灵活性velocity-ratio-ellipsoid redundant robot proportion-regu

新农村建设别变调

也许我出生在农村,也许我的根还扎在农村,于是我对新农村建设也就特别关注。去年,我三次参加作家采访团,去邯郸、日照、桂林等地的农村参观学习。亲眼所见,新农村建设在稳步

期刊

快速康复外科理念在胃肠外科手术围手术期护理中的应用

目的探讨快速康复外科理念较传统护理在胃肠外科手术围手术期治疗效果的优越性.方法选取项城市中医院2015年6月至2016年9月收治的80例直肠癌患者,均行腹腔镜直肠癌根治术,

期刊

快速康复外科理念胃肠外科手术围手术期

学校现代化背景下高职体育教师职业素质的提升

体育教师职业素质直接影响着学校体育教育整体水平,学校可通过加强体育教师的政治素质现代化、思想道德现代化、业务素质现代化、身心素质现代化以及学校体育管理制度的现代

期刊

高职体育教师职业素质学校现代化

基于高层信息特征的重叠语音检测

与本文相关的学术论文