【摘 要】
:
汉语是目前世界上使用人数最多,分布广泛度居第二的语言,随着中国在全球影响力的增加,世界各国正在兴起一股“汉语热”。中国作为汉语使用人口数量最多的国家,随着国内经济发
论文部分内容阅读
汉语是目前世界上使用人数最多,分布广泛度居第二的语言,随着中国在全球影响力的增加,世界各国正在兴起一股“汉语热”。中国作为汉语使用人口数量最多的国家,随着国内经济发展的与日俱增、都市化的步伐加快,不同城市之间的人与人交流日益频繁,一些如公共信息安全、语言学工程、智能检索、公共设施等领域的完善对方言识别技术的需求越来越大,未来发展汉语方言识别技术的潜力和契机也将无限广阔。本文着眼于非特定人孤立词对湖南地区方言进行辨识及识别。为反映方言的动态特性及其声道特性,采用LPCC、MFCC和各自一阶差分系数组合成代表方言的48维混合特征参数,提高了汉语方言识别系统的识别率和抗噪性能。本文在分析Adaboost集成、BPNN、 HMM模型的基本理论及算法基础上提出了方言辨识方法和识别方法。其中一种是将BPNN和Adaboost机器学习算法相结合的汉语方言辨识方法,先利用多个BP神经网络作为弱分类器对方言进行初步辨识,再借助Adaboost迭代算法将这些BPNN合并起来构成分类精度更高的强分类器,这种方言辨识方法利用了Adaboost的自适应权值提升了BPNN的分类能力。通过建立在不同信噪比、不同特征参数、不同辨识模型情况下辨识率的对比试验,结果表明混合特征参数较其他特征参数具有更好的表征性及抗噪性,基于BP Adaboost辨识方法也具更高的辨识率。另外一种是将隐马尔科夫模型与BP_Adaboost模型相结合的汉语方言识别方法。已知按第一种方法获得到某个方言孤立词的地域信息后,然后主要利用Baum-Welch、Viterbi算法进行训练及识别,通过BP Adaboost进行第二次识别后综合得出最终结果,对比参数库中的方言标识得出其具体含义。这种混合模型充分吸收了HMM模型的时序建模能力和集成NN的强分类能力。实验结果证明,上述两种方法较BPNN或HMM方言识别方法具有更强的噪声鲁棒性和较高的识别率。
其他文献
本试验室构建了带有枯草杆菌安舒克栓酶基因的质粒pUBH。该质粒在蛋白酶缺陷型表达受体菌DB403中能够实现正确表达枯草杆菌安舒克栓酶(AT)。AT对纤维蛋白有直接的降解作用,
随着我国2015年马铃薯主粮化战略的启动,相关产业得到快速发展。马铃薯品质直接影响到深加工产业的经济效益,对其分级是进行工业化生产的重要前提。目前机械分级的方式易对马铃薯造成二次损伤,且只能检测单一特征;而人工检测效率低、成本高。因此进行快速无损马铃薯品质分级算法研究具有重要意义。本文对马铃薯形状分类与外部缺陷检测算法进行研究,并在硬件上实现算法的验证。主要研究内容及成果如下:1.设计了基于机器视
移动通信和互联网成为当今世界发展最快,前景最诱人的业务。它们的增长速度都是任何预测家未曾预料到的。在移动互联网中有海量视频需要处理、存储。因此作为移动互联网的终端
随着现代传感器技术和信息技术的迅速发展,不同分辨率的对地观测遥感数据极大丰富,为遥感理论研究和实践应用提供了重要的数据支持。多时相遥感影像的变化检测是遥感应用的重要方面,并已经在国民经济和国防建设领域得到广泛的应用。通过分析同一地域不同时相的遥感图像,变化检测提供地物发生变化的信息,用于资源和环境监测、自然灾害评估以及战场态势分析等。迄今为止,众多学者已经提出了多种变化检测方法,按照处理信息的复杂
低噪声放大器(LNA)位于射频接收前端的第一级,它的噪声特性将大大影响整个射频接收系统的噪声性能。然而已有的LNA噪声优化方法中没有考虑栅极寄生电阻产生的热噪声对LNA噪声
分布式光纤温度检测技术是在温度检测方面新兴的一种检测技术,分布式光纤测温从20世纪中后期由光纤通讯发展而来。作为一种年轻的检测技术,分布式光纤测温经过几十年的发展,
错配修复是DNA损伤修复的一个重要途径,主要司职DNA合成、遗传重组及损伤过程中新发生的单个及少数碱基的缺失、插入及错配,对维持基因组稳定性和DNA复制保真度至关重要。水稻
图像缩放是指图像分辨率的改变,也叫图像重采样,是数字图像处理中的关键技术之一。数字图像缩放算法可以分为基于像素的图像缩放算法和基于边缘的图像缩放算法。基于像素的图
进入21世纪以来,随着纳米技术的飞速发展,稀土掺杂的纳米材料因其在光、电、磁等方面显现出的优异的性质而受到了科研工作者的广泛关注。其中,稀土掺杂纳米材料在增强太阳能效率和荧光测温领域的应用成为研究热点。一方面,由于太阳能电池材料本身的能带间隙小(1.12eV),而太阳光谱是一个宽光谱,导致太阳光中的很大一部分红外光和紫外光无法被电池吸收利用。因此,寻找优异的光谱转换材料成为提升太阳能利用效率的关键