面向智能手机语音识别应用的汉语语音数据库

来源 :第十一届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:gzhaohuo892
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文介绍了面向智能手机语音识别技术应用的大规模汉语语音数据库,本数据库也可以作为 训练和测试样本用于语音识别的研究与产品化。考虑到实际应用场景,本数据库共采集1200人语音,每人分别在安静和噪声环境下以朗读、自由回答等方式录制150句,语料内容涵盖手机应用的各种情况,每份语料各不相同,同时手机设备覆盖目前主流的四款智能手机操作平台,并且对发音人性别、年龄、方言区进行了很好的均衡。除语音文件外,本数据库对多种噪声进行了详尽的转写标注,提取并校对了囊括了词频和拼音信息的汉语发音字典。
其他文献
  本文构建了一种三特征流混合动态贝叶斯网络(T_AsyDBN)听视觉情感识别模型,听觉流采用MFCC特征和经过PCA降维的局部韵律特征,视觉流定义了二维面部几何特征和三维面部动作参
会议
  为了更好的消除动态轨道衡称重系统中存在的误差,提高称重精度,本文对动态轨道衡称重系统在称重过程中所可能产生的误差分三个方面进行了分析,指出了各个误差产生的原因以及
医学类高校发展正在进入快车道,政府采购金额也随之大幅度增加.医学类高校政府采购具有专业性强、时效性高、项目多、金额大等特点.本文主要从医学类高校政府采购及其内部控
在建筑工程整体施工中,给排水工程施工质量会直接影响到建筑物的整体质量和安全性能.本文从提升建筑给排水工程施工质量管理必要性和质量问题出发,论述了如何做好建筑给排水
  本文通过严格控制的实验研究了话题结构和句子长度对句间停顿的调节模式,并比较了性别差异。语料是由两 个句子构成的小语篇,通过改变第二个句子控制两种句子长度(短和长)
会议
  说话人在发音时面部肌肉的活动会产生电信号。本文对EMG信号的原理及特征做了简单的梳理,并通过比较汉语普通话元音的有声,小声和无声三种发音模式下的肌电信号,进一步分析
  本文针对汉语学习者的发音偏误问题,通过统计绝对值变化和建立高斯混合模型的方法比较了两类发音参数: 一是反映声调和语调信息的音高信息及其衍生参数、二是反映声道和声
房屋建筑工程是城市规划建设中的基础工程,其质量和安全对人们的日常生活具有一定程度的影响.工程建设中,经常会出现渗漏问题,这对整体建设的质量影响较大,应该引起重视.建筑
  本文主要研究了藏语夏河话辅音的唇形,首先录制了藏语夏河话不同发音部位的14个单辅音的唇形视频,根据编写的内外唇线的标记程序,进行14个关键点的手工标记,对不同发音部位的
  本文提出了一种基于主动外观模型(AAM)特征和异步发音特征DBN模型(AF_AVDBN)的逼真可视语音合成方法。在 AF_AVDBN模型中,发音特征(如嘴唇、舌体和声门/软腭的状态)之间允许
会议