方言转换系统中的语音识别技术研究

来源 :北京信息科技大学 | 被引量 : 0次 | 上传用户:www860227
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文研究了用于方言转换的语音识别技术,包括说话人自适应算法、连续语流音节切分算法和基于加权有限状态转录机(weighted Finite State Transducers,WFST)的关键词识别算法。普通话与沈阳、济南和西安三种北方方言之间的差异,主要体现在声调的基频模式和特殊词汇的发音上。论文而向普通话到这三种方言的实时语音转换,构建了方言转换系统。   论文工作的主要贡献如下:   1.论文根据方言的发音特点,给出了说话人音色自适应方法。确定了说话人自适应的语料;并利用隐马尔科夫模型(Hidden Markov Model,HMM)强制对齐算法(Force Alignment)来去除个性化语音中的静音,同时用这种方法还实现了特殊声韵母的切分。   2.提出了一种基于自动机的逐级音节切分算法,该算法和于支持声调转换。方言转换是以声调基频模式转换为基础的,而声调以音节为单位。因此首先要对连续语流进行音节切分,在音节的基础上进行基频模式转换。音节切分的准确性将直接影响基频模式转换的效果。   3.实现了基于WFST的关键词识别算法。在方言转换系统中,设计了一个基于方音差异的小词表。并利用皋于WFST的连续语音识别算法实现了方言特殊词汇检出,用于在方言转换中特殊训汇转换。
其他文献
随着计算机网络的快速发展,以Web服务为核心的分布式计算模式正在成为技术发展的趋势,然而,单个Web服务功能有限,跨组织的流程可能涉及到多个复杂业务,因此需要将独立的Web服务进
近年来,随着网络技术和Internet的迅速发展,基于Browser/Server结构的Web应用,因其具有易用性、通用性和良好的可扩展性等优点而发展迅速,正逐渐成为实现企业应用信息系统的
近几年来,随着智能手机技术的进步,其相关的软件业也得到了爆破式的发展。因为Symbian OS在智能手机市场占有率上占有压倒性的优势,所以Symbian软件已经成为最为普遍的智能手
近年来,分布式拒绝服务攻击(DDoS,Distributed Denial of Service)严重影响着Internet安全,给Internet的应用和发展带来了极大危害。目前,网络流量的自相似性、时间序列分析
社交媒体拥有巨大的用户群体,这些用户在社交媒体中留下的活动记录不仅是用户行为的真实反映,同时也记录着社交媒体中的信息传播过程。为研究应急事件背景下用户行为及信息传播
地图数据在网络环境下的可视化展现是一门飞速发展、应用也越来越广泛的综合性技术,能为决策者提供各种决策信息支持,可提高决策的质量和效率。基于AJAX和WEBService实现的WE
颅面测量作为人体测量的一个重要组成部分,在人类学、解剖学、临床医学、法医学、医疗器械设计、国家安全、人体识别、生物医学工程等领域有着广泛的应用。同时,如何充分利用
学位
用户界面的设计在计算机软件系统的设计中占有重要地位。尽可能早地将用户融入到设计过程中,建立界面原型,设计和描述界面的交互行为,对于快速迭代,获取用户评估意见,提高可
无线Mesh网络是近年来一种新兴的无线局域网技术。无线Mesh网络在提供网络服务的Mesh节点之间建立路由联系,不需要每个Mesh节点都与有线网络直接连接,极大地方便了无线网络的