【摘 要】
:
在基于随机分段模型(Stochastic Segment Model,SSM)的大词汇量连续语音识别(LVCSR)系统中,分步段解码及剪枝算法能够明显的减少解码计算量。一般情况下,我们每次都是基于单
【机 构】
:
中国科学院自动化研究所,北京 100190
论文部分内容阅读
在基于随机分段模型(Stochastic Segment Model,SSM)的大词汇量连续语音识别(LVCSR)系统中,分步段解码及剪枝算法能够明显的减少解码计算量。一般情况下,我们每次都是基于单独段进行解码。本文提出了一种基于相邻段的解码方法,该方法对多个段同时进行解码,从而每段的剪枝阈值能够被多个段所高度共享。这也意味着避免了更多的无用计算,解码速度大大加快。将该方法应用于LVCSR系统中,实验证明,在不影响识别精度的情况下,可以将解码时间减少50%。
其他文献
本文研究了基于细胞DNA定量分析的宫颈癌筛查技术。对宫颈组织样本进行Feulgen染色,通过CCD摄像机采集细胞核的显微图像,综合应用区域和边界的方法实现细胞核的图像分割。计
步态识别足一种新的生物识别技术,它通过人行走的姿势来实现对人身份的鉴别。本文提出了一种新的基于标准差能量图的步态识别方法,首先将视频序列中分成若干个步态周期,然后
为实现CT图像上肝脏区域自动分割,本文提出一种基于梯度向量流-蛇模型的方法。首先采用直方图均衡与各项异性扩散滤波的方法对图像进行预处理,之后采用基于区域分析的方法获
本文针对维吾尔文字的特点,提出了一种应用BP学习算法对维吾尔文字符识别。首先利用投影分离出连体段中的字符,再将预处理后的维吾尔文字符图像利用BP神经网络对子块图像进行
本文提出一种利用自动语音识别技术来有效检测第二语言学习者的错误音素发音系统。本文的方法通过预测语言学习者发音中可能导致错误发音的音素混淆规则来扩展标准发音词典,
音频分类主要以一些主观或者客观的音频特征为基础,音频特征的选取要能够充分体现出音频在时域和频域中的重要分类特性。因此,音频特征的分析与提取也就成为音频分类问题的基
随着互联网上可用信息的日益增多,怎样快速而有效地获取有用信息成为人们研究的重要课题,信息自动分类就应运而生了。贝叶斯作为其中的一种分类方法,应用在很多领域。本文将
处理指纹图像中存在的非线性形变是目前指纹匹配研究所面临的难题之一。在指纹采集过程中,由手指弹性及按压压力等闪素所引入的非线性形变给识别同一手指的多个不同样本带来
针对现有变压器故障诊断方法在诊断性能、适用性及知识获取等方而存在的不足,利用人工免疫系统强大的识别、学习能力和粗集的属性客观约简,提出一种融合粗糙集理论的变压器故
在中文文本自动分类系统中,文档通常采用向量窄问模型(VSM)表示,所有文档属件构成一个高维度的属性空间,而在文本分类中高维度的特征空间是一个难以解决的问题。TFIDF是文档