基于动态贝叶斯网络的音视频连续语音识别和音素切分

来源 :计算机应用 | 被引量 : 0次 | 上传用户：bafjeght

【摘要】

：

构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在

【作者】

：

吕国云蒋冬梅蒋晓悦赵荣椿侯云舒孙阿利 H.Sahli W.Verhelst

【机构】

：

西北工业大学计算机学院,西北工业大学计算机学院,西北工业大学计算机学院,西北工业大学计算机学院,西北工业大学计算机学院,西北工业大学计算机学院,布鲁塞尔自由大学电子与信息处理系,布鲁塞尔自由大学电子与

【出处】

：

计算机应用

【发表日期】

：

2007年07期

【关键词】

：

动态贝叶斯网络音视频语音识别音素切分

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0～15dB)时,DBN模型的识别率比HMM模型平均高12.79%;而纯净语音下,基于DBN模型的音素时间切分结果和三音素HMM模型的切分结果很接近。对基于视频特征的语音识别,DBN模型的识别率比HMM识别率高2.47%。实验最后还分析了音视频数据音素时间切分的异步关系,为基于多流DBN模型的音视频连续语音识别和确定音频和视频的异步关系奠定了基础。 Two dynamic monophone dynamic Bayesian Networks (DBN) models are constructed to realize continuous speech recognition based on audio and video features. On the basis of the specific relationship between descriptors and corresponding phonemes, the time-cut of phonemes Minute. Experimental results show that in the aspect of audio feature-based recognition rate, the recognition rate of DBN model is 12.79% higher than that of HMM model at low signal-to-noise ratio (0 ~ 15dB); while pure speech, The sub-result is very close to the segmentation result of the triphone HMM model. For speech recognition based on video features, the recognition rate of DBN model is 2.47% higher than HMM recognition rate. Finally, the experiment also analyzes the asynchronous relationship of the time segmentation of the phoneme of audio and video data, which lays the foundation for the continuous speech and audio and video based on multi-stream DBN model and the determination of the asynchronous relationship between audio and video.

其他文献

最好的版本

上期的专栏中我说过,超过250元一张的DVD,我是不会考虑买的。但是有一例外,就是大师级的TheCriterionCol-lection(简称为CC)出版DVD。CC的DVD卖得特别贵,这个品牌今天的超凡

期刊

吴宇森DVD法国新浪潮喋血双雄瓦尔达

10kV频繁跳闸线路故障分析及改进措施

10k V配电线路是电网的重要组织部分,是直接连接广大电力客户的社会公共服务平台,是电网企业履行社会责任、树立品牌形象的重要窗口。因此,为用户提供安全可靠、优质清洁的电

期刊

10kV线路跳闸故障影响因素改进措施

复方异丙托溴铵联合布地奈德雾化吸入对慢性阻塞性肺疾病急性加重期的疗效

目的复方异丙托溴铵联合布地奈德雾化吸入对慢性阻塞性肺疾病急性加重期的疗效。方法将50例COPD患者作为研究对象,随机分成观察组和对照组,各25例。对照组的患者采用复方异

期刊

慢性阻塞性肺疾病急性加重期复方异丙托溴铵布地奈德雾化治疗

光环境与色彩设计

光与色是环境设计中不可轻视的视觉要素.从自然光与人造光,光的色温与光的演色性,色光的混合与材质的表现几方面论述了光色原理及其在环境设计中的应用,为人们合理利用自然光

期刊

光环境艺术色彩学艺术设计

学校体育法治建设探析

随着我国社会主义法治建设的不断推进，学校体育法治工作也取得了显著成就。一系列学校体育法律法规的制定使学校体育工作开展有法可依，有力地推动了学校体育事业的发展。但是，在

期刊

体育法治学校体育工作条例有法不依建设探析

芝麻全基因组Hsp70基因的鉴定与生物信息学分析

利用隐马可链夫模型（HMM）对芝麻全基因组Hsp70基因进行了系统分析,共鉴定出21个Hsp70基因,其中17个属于Dnak基因亚家族,4个属于Hsp110/SSE基因亚家族。根据系统进化树分析和亚

期刊

芝麻Hsp70基因生物信息学分析

吡格列酮联合二甲双胍治疗肥胖2型糖尿病的疗效观察

目的：探讨吡格列酮联合二甲双胍治疗肥胖2型糖尿病患者的临床疗效。方法：选择100例肥胖2型糖尿病患者，采用随机数字表法分为治疗组和对照组，各50例。对照组服用格列齐特缓释片加

期刊

吡格列酮二甲双胍2型糖尿病

现代画报建构的成功故事——以《北洋画报》为例

现代画报是现代社会的主要媒介之一,探讨现代画报的图像呈现视角与方式是对现代社会的一种解读。《北洋画报》是20世纪20、30年代中国现代画报的代表,它从彰显职业本色、强调

期刊

《北洋画报》现代社会成功故事杨秀琼

复方孕二烯酮阴道环组分的测定方法学研究

目的：建立复方孕二烯酮阴道环组分的高效液相色谱（HPLC）测定方法.方法：采用HPLC法,色谱条件如下,色谱柱Diamonsip C18（250 mmx4.6mm,5μm）,流动相乙腈-水（50∶50,v/v）,检测波长孕二烯

期刊

孕二烯酮炔雌醇阴道环测定方法

整体偏好次序下个体偏好次序的变化研究

研究整体偏好次序和个体偏好次序的关系发现，当整体中的个体具有学习能力和理性时，个体为了自身的稳定存在和发展，其偏好次序会自发地向整体偏好次序趋同。

期刊

整体偏好次序个体偏好次序企业市场行为

基于动态贝叶斯网络的音视频连续语音识别和音素切分

与本文相关的学术论文