基于词片和Lattice的汉语语音检索技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:only16666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音检索是语音识别研究中的一个新领域,其目的是在大量语音资源中搜索和返回与用户给出的查询词(Query)相关联的语音段或语音文件。它通过事先为语音资源建立索引,从而实现了基于语义内容的快速搜索。本文的主要工作是研究汉语语音检索系统的性能优化策略。首先,系统地介绍了语音检索系统的框架和原理。其次,对语音检索系统前端自动语音识别器( Automatic Speech Recognition,简称ASR)的语言模型进行优化。为充分利用音节和音节之间相互搭配的语言学信息,提出汉语中词片的概念。并将词片用作语言模型基元,给出了简单有效的词片选择算法。利用音节标注语料,经过词片选择,就可以利用其训练音节/词片语言模型。将音节/词片语言模型与词语言模型线性融合得到混合语言模型。音节/词片语言模型和混合语言模型应用到连续语音识别系统中,分别较音节语言模型和词语言模型取得了更好的识别结果。第三,给出完整的语音检索在线部分处理过程,包括利用音节Lattice建立索引,Query词的搜索,根据后验概率进行词确认,以及交叠处理等步骤。提出将含有表示多音节基元的Lattice转换成只含有单音基元Lattice的方法,并将其应用到建立索引的过程中,有效地避免多音节基元影响词表外词(Out-of-Vocabulary,简称OOV)的词检出问题。并在提出边分解方法的基础上,对Lattice中冗余顶点进行去除,在仅牺牲很小检出性能的情况下,使Lattice规模大幅度减小,词检出速度提高。对利用几种语言模型解码得到的Lattice建立索引,进行词检出性能的比较。最后,在结论中对语音检索的进一步研究方向进行了讨论。
其他文献
在企业国际化浪潮下,各种现代化企业必须快速、协调、有效地完成企业内部各种业务流程的部署以满足市场变化和客户需求。然而,企业的IT基础架构却缺乏有效应对市场需求的灵活性
多源信息的集成是目前采矿企业安全生产监控系统建设的一个重要课题。针对井下生产系统多数据源、多数据类型、多媒体结构的特点,重点研究了矿用信息平台的信息集成技术,并设计
个性化服务推荐系统已获得广泛应用。然而,现存的推荐系统用户模型,多数基于网络数据,数据维度较少或不分维度进行网状语义建模,通过用户打分、点击等外部行为以及用户年龄、
随着通信技术的发展以及集成电路和微处理器在汽车上的广泛应用,汽车电子已呈现出网络化的发展趋势,车上网络技术己成为汽车电子领域的研究和应用热点。局部互联网络LIN(Loca
本文介绍数据挖掘有关概念和技术,阐述关联规则挖掘的研究现状,论述了时态数据挖掘研究背景和进展,引出本文所要研究的内容。并给出关联规则的挖掘过程,研究关联规则挖掘算法
随着21世纪的到来和互联网技术的迅速发展,信息安全变得越来越重要。密码学和密码算法是信息安全的核心技术,密码算法的安全性决定了信息安全的强度,而其性能也将决定信息安全对
随着数据爆炸式地发展,有效地挖掘数据背后的知识至关重要。形式概念分析作为研究认知科学的一种有力工具,如今已经在数据挖掘和知识发现等诸多领域中有了广泛的应用。形式概
在各个高校中,信息管理系统和网络资源发挥着巨大的作用。然而这些系统在构建时缺少全局的规划,系统结构、数据结构、操作平台、存取方式等都不同,致使系统之间很难进行数据交换
以往的研究工作对Web服务器QoS控制和集群负载均衡策略的研究是相对独立的,两者的分离使得分配器的负载均衡策略没有考虑到HTTP请求的QoS类型。分配策略直接影响到Web服务器
公文流转系统是电子政务建设中的核心和基础系统,它的开发与应用已经成为各级政府机关政务信息化的主要内容。由于政务办公的特殊性,公文流转过程中的安全问题一直受到广泛的