基于BTSM—LDA的口形动态特征及多流异步音视频语音识别

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户:zhangbaichi001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
引入一种基于贝叶斯切线形状模型(BTSM)的口形轮廓特征提取和基于线性判别分析(LDA)的视觉语音动态特征提取方法,该特征充分体现了口形特征变化的动态性,消除了直接口形轮廓几何特征的冗余。同时采用一种新颖的多流异步动态贝叶斯网络(MS—ADBN)模型来实现音视频的连续语音识别,该模型在词节点级别体现了音视频流的同步异步性。识别实验结果表明:采用LDA视觉语音动态特征的系统性能明显优于静态的口形轮廓几何特征,在语音信噪比为0~30dB的测试环境下,融合LDA视觉特征的MS—ADBN模型比多流异步HMM的平均
其他文献
文章依托实建项目,该项目地处落后地区且为热带雨林气候。通过对其大体积混凝土浇筑施工方案的论述,对如何在不发达地区、热带雨林气候下进行大体积混凝土浇筑进行归纳总结,
计算机监控软件已经成为软件设计的一个重要领域。然而设计这类软件难度很大,尤其是其界面的设计一定要简洁高效,使用户方便使用,并能使用户迅速地对监控对象所发生的问题做出有效的处理。本文结合自己的实践提出了用地图的方式来进行监控的方法,并阐述了这种方案的实用价值和实现方法。
从图书搜索引擎概况、常用的图书搜索引擎资源、图书搜索引擎的检索途径和图书资源的利用方式4方面,对图书搜索引擎资源及其利用进行了探析。
节能是贯彻落实科学发展观的重要举措,全面推进建筑节能工作,有利于减少建筑能耗,节约能源;有利于环境质量;有利于传统建筑业的改造和提升,转变城乡建设增长方式,调整经济结
期刊
本文对计量检定及其相互关系的配合进行了分析.
期刊
竖井开挖的导井退碴法缪见武(福建省宁德地区水电工程局宁德县352100)调压井是引水式电站的主要水工建筑物之一,其竖井开挖难度大、工期长、材料消耗多,加之高空作业、质量要求高的特点
随着社会主义市场经济建设不断推进,国家为了加快实现建设新农村的目标,从农村经济发展需求的总体标准出发,制定了乡村振兴战略。在乡村振兴战略背景下,农村的财务审计较以往
【正】2013年7月6日,BBC体育节目主持人因沃代尔在主持温网利斯基与巴托丽的女单决赛时说:"你们觉得巴托丽的爸爸在她小时候,是不是这么跟她说的,‘你永远不会变成像莎拉波娃
全面系统地介绍了风力提水技术在天津市的开发与应用情况,内容包括区域风能资源评价;风力提水机组的研制;风力提水机组微机监测系统的研制及风力提水技术在农田灌排水,养虾等领域
鉴于图像匹配需要解决时效性和不同模态图像适用性的问题,提出了一种利用划分强度一致(Partitioned intensity uniformity,PIU)测度和遗传算法(Genetic algorithm,GA)实现图像匹配的方法。在对PIU测度进行研究分析的基础上,提出用PIU的改进形式PIU′作为图像匹配的相似准则,并对传统的遗传算法进行一系列的改进作为匹配过程的优化策略。PIU′的选取使得