基于隐马尔可夫模型的汉语语文转换的研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:cx77287728cx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文从汉语语音的特点、隐马尔可夫模型、语文转换等三个方面展开论述,具体的安排分为五部分:第一部分介绍了语音识别系统的基本结构组成,并对各个组成部份做了简单介绍.第二部分讨论了语音信号的前处理,包括采样、预处理和特征提取.详细讨论了语音信号的分析方法和两个重要的特征参数——MFCC参数和LPC参数,并且介绍了动态语音参数及其作用.第三部分讨论了HMM的基本理论,包括基本定义、基本算法和类型结构.详细讨论了HMM在语音识别中的应用,从孤立词识别和连续语音识别两方面进行详细阐述,包括模型的选择、模型的训练以及识别的路径搜索方法.第四部分讨论了汉语语音的特点以及汉语语言模型的建立,包括语法规则和发音词典的建立方式,并且研究了基于音节的汉语语言模型的建立和基于词的汉语语言模型的建立.第五部分综合了前面的知识建立了一个汉语语文转换实验系统WHU,详细讲述了系统各个模块的具体设计方案.并从孤子词和连续语音两方面对该系统进行了测试,测试的结果为下一步的研究提供了方向.
其他文献
半胱氨酸蛋白酶是生物体内蛋白水解的主要参与者,参与了生物体的细胞凋亡、组织降解、免疫防御等过程。家蚕半胱氨酸蛋白酶抑制剂(BmCPI)作为家蚕半胱氨酸蛋白酶(BCP)的专性抑
乌头Aconitum carmichaeli Debx为毛茛科乌头属Aconitum植物,附子Radix Aconiti Lateralis Preparata为乌头栽培种的侧根,是一种“回阳救逆”的名贵中药,道地产地为四川江油
MPEG-4 AAC编码标准是由ISO/IEC运动图像专家组为进一步提高音频编码压缩性能而制定的新一代音频编码标准,是MPEG-4音频编码标准的核心。MPEG-4 AAC编码标准是目前所有感知音
体绘制技术是一种重要的科学计算可视化方法,它可以通过抽取体数据集中内在的本质信息,并采用计算机图形图像处理技术直观地展现出来。该技术适合生成原始数据集的整体图像,
水声图像具有直观和可视化等优点,目前已经获得了广泛的应用,但是如果要进一步应用水声成像迫切需要解决一些关键技术。论文围绕基于角域滤波水声成像的关键技术这一主题,开展了
该文在对基于语义和基于声纹的说话人识别技术研究的基础上,提出在分段线性映射的基础上将不同技术统一到一个相同的框架下,分阶段利用语义信息确认技术来增强文本无关声纹确
脊椎动物的中枢神经系统(CNS)是非常复杂并具有高度组织性的系统,细胞的多样性是神经系统的显著特征之一。尽管神经元和胶质细胞都具有重要功能,但目前对其发育和分化的具体机
SDH体制具有传输容量大、组网灵活、长途传输质量高等优点,因而其应用日益广泛,不仅可用于光纤传输系统,而且在微波传输系统中也被大量采用。高效高速的多电平正交幅度调制(M
Shotgun技术是大规模蛋白质鉴定的重要方法,能在一次实验中获得大量的数据,而这些数据的可靠性是蛋白鉴定的一个重要问题。当前关于鉴定结果质量控制的研究主要集中在肽段水平
干热河谷是中国西南横断山区一种非常特殊的气候类型,该地区的气候特点主要是干热少雨,且季节变化明显。干热河谷地区的植被恢复极其困难,选择什么样的树种用于干热河谷地区的造