语速大范围变化时汉语语音识别模型的改进

来源 :第十三届全国信号处理学术年会 | 被引量 : 0次 | 上传用户:a5354796
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了一种新的汉语语音模型-多组状态转移顺序聚类模型(MSSC)。该模型采用了马尔可夫过程的状态转移方式,描述汉语语音的特征矢量序列的时序过程,同时采用了动态时间匹配DTW的比对概念和直接特征状态而不是HMM法的隐状态。该模型具有多组子模型特点,在描述状态转移方面,增加了记录各状态的自转移次数,用其作权重可更好地利用特征信息,提高了在语速大范围变化时的识别率。
其他文献
地铁是城市公共交通重要组成部分之一,地铁安全的重要性不言而喻。近年来全球地铁事故不断发生,我国的北京、上海、广州等城市地铁先后发生不少事故。因此,分析地铁运营事故
白天观测条件下高亮度的天光背景使空间目标淹没在强的背景噪声中。在强背景条件下有效地将目标提取出来将明显地拓展目标的探测时段和提升探测系统的性能,因此,开展强背景下
会议
近年来,安全问题日益得到人们的重视,因而扩大了视频监控系统的应用领域,视频监控技术也得到了迅速发展。运动检测作为视频监控系统中视频处理的第一步,具有举足轻重的地位,
确定眼坐标系和场景坐标系之间映射关系的标定过程是视线跟踪算法实现的关键技术。本文采用最小二乘法解决多元线性回归问题的思路,提出了一种基于最小二乘法的瞳孔-角膜矢量
会议
(一)党中央和毛泽东同志最近强调地提出了加强农业战线、加速实现农业技术改造的任务。为了完成这个任务,就必须在毛泽东思想指导下,大力加强农业科学技术工作。马克思列宁
本文提出了一种基于核广义鉴别分析(GDA)和支持向量机(SVM)的人脸表情识别算法。首先采用GDA算法提取人脸表情特征,再利用SVM对特征空间数据进行分类,在JAFFE人脸表情静态图
本文提出了一种新的车牌快速定位方法。该方法采用设定车牌HSV分量范围的方式,在HSV空间中将符合要求的图像像素提取出来,得到包括车牌区域在内的几个连通区域。然后采用信息
为利用低温半致死温度(LT50)快速鉴定评价甜椒的抗寒性,本研究以‘多福’甜椒叶片为试材,通过测定不同低温强度(12℃,8℃,4℃,0℃,-4℃)和不同处理时间(0 h,1h,2h,4h,8h,16h,
针对SVDD在解决两类(多类)识别问题时所产生的误判率较高、识别率低于普通二类SVC分类器的问题,提出了一种具有多层结构的SVDD模式识别方法。该方法在训练时对每一类样本训练
老化是自然规律,任何人也无法阻挡。但人老化的进展速度可因人而异,正因为如此才有个体间死亡年龄的差别。影响老化速度除存在于自身无法改变的因素(如遗传、先天发育障碍、