高性能汉语数码语音识别芯片系统

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:muyue3122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在嵌入平台上实现高性能的汉语数码语音识别(MDSR),对于电话通讯、工业控制等都具有极高的实用价值。该文描述了一个在16bit定点DSP芯片上实现的高性能汉语数码语音识别系统。识别模型采用连续隐Markov模型(CHMM),识别特征采用Mel频标倒谱系数(MFCC)。在模型的训练中引入MCE区分性训练进一步提高了系统的识别性能。识别过程采用单级识别框架,降低了芯片上系统部分的复杂性,同时保证了很高的识别性能与稳健性。实验证明该系统对11汉语数码发音可以达到98.3%的识别正确率,在58.5MIPS的16bit定点DSP上进行一次识别只需要35ms。 The realization of high performance Chinese digital speech recognition (MDSR) on the embedded platform has extremely high practical value for telephone communication and industrial control. This article describes a high-performance Chinese digital speech recognition system implemented on a 16-bit fixed-point DSP chip. The identification model adopts the continuous hidden Markov model (CHMM) and the recognition feature adopts the Mel Cc cepstrum coefficient (MFCC). The introduction of MCE discriminative training in model training further improves the recognition performance of the system. The identification process uses a single-stage identification framework, reducing the complexity of the system components on the chip, while ensuring high recognition performance and robustness. Experiments show that the system can achieve a recognition rate of 98.3% on 11 Chinese digital utterances. Only 35ms is needed to recognize a 58bit MIPS on a 16bit fixed-point DSP.
其他文献
对澜沧江流域山区典型试验样区遥感数据运用AHP递阶层次结构 ,将土地覆盖类别分成若干层次。结合特征选取与采用多种分类算法组合 ,先进行类间易于区别的大类别的分类信息提取处理 ,得到一层次的分类结果 ,再基此对各分类结果探索进一步的分类处理 ,获得第二层次的分类结果。如此进行 ,直至分出所有确定类别。试验结果表明 ,该分类组织较之传统基于一次特征选取所进行的单级分类技术组织实施 ,具有构思科学合理
 从六倍体小黑麦和普通小麦杂交后代中选育了9个具不同抗条锈特性的新种质,对其细胞学和主要性状特点进行了初步鉴定。结果表明,抗条锈新种质材料的田间表现无不良的农艺性
应用线性回归、非整数波谱和小波分析等方法 ,分析了东北玉米主产区热量资源的长期演变趋势和变化周期 ,并对未来 1 0a的情况进行初步预测。要素包括 :日平均气温稳定≥ 7℃
利用cDNA-AFLP技术,比较分析了一个甘蓝与两个青花菜自交系回交转育的显性核基因雄性不育材料与对应可育亲本植株花蕾发育过程中基因表达的差异.将花蕾混合提取RNA合成cDNA建
研制了一种200 kV/100 kA环轨式场畸变开关.该开关以Ar、N2、SF6及SF6/N2、SF6/Ar混合气为工作介质,试验结果表明:开关自击穿电压最大偏差
提出了一种新的基于转矩大小的距离保护Ⅰ段反时限特性实现方法,给出了转矩的定义式及计算方法,并针对具体的反应相间故障的阻抗继电器推导了其转矩表达式.大量的仿真计算表
1 INTRODUCTIONThe emission of nitrogen oxides (NOx) is one of the major causes of acid rain.The use of metal chelate additives in wet flue gas desulfurization (
分析了补偿电网单相经电阻接地的现象,利用消弧线圈电感变化前后的系统零序电压和零序电流定义了零序电流综合增量概念.给出了零序电压、零序电流和综合增量的向量图及不同接
揭示了相控电抗器式可控串补与相控电容器式可控串补的对偶特征。用对偶原理阐述了相控电容器式可控串补的性能及相控特点。分析说明了串补电容器、GTO阀的电流电压峰值与串
为实现金自主足球机器人的定位和避障,介绍了超声波定位避障系统的体系结构,说明了超声波传感器的这种分布应用于足球机器人的必要性及这种结构的优点.针对超声波传感器测量