语音片段检索算法的研究与应用

被引量 : 0次 | 上传用户:john_cai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了现有语音检索中语音到文本和语音到语音两种检索方式。对语音端点检测中双门限法进行了改进,提出了双向双门限加基于波形统计的字切割算法,利用动态时间弯折法对该方法进行了无阈值、自动合并波形的改进。并针对现有检索算法中要切分段和抽取关键词的缺点,尝试了一种基于动态时间弯折的不需切割的连续语音片段检索算法,并对该方法进行了有效的评估。另外针对语音到语音的检索方式中只应用了语音的特征匹配、语音到文本的检索方式中只应用了语音的出现概率问题,提出了一种基于隐马尔科夫模型的连续语音到语音检索算法。该算法同时利用了被检索语音和检索语音之间的特征相似度以及语音前后帧之间的出现概率,实现了较全面的语音到语音检索方式,同时由于该算法的隐马尔科夫概率矩阵的计算由条件概率方式得到,无需进行反复迭代训练,训练时间大大的提高了。针对现有语音转文本的方式在语音检索中准确度不高的问题,提出一种带条件概率的中间模糊音素声学模型,将语音识别成一种模糊的中间音素(即将发音类似的音素聚类成一个)的文本,通过文本检索方法检索大概位置,然后再使用不切割语音到语音算法来进行精确的查找。最后针对上面两种语音到语音检索算法,本文给出了特殊情况下两者等价性的分析。并比较他们在实际应用场合上各自的优缺点。
其他文献
世界银行于1965年制定《解决国家与他国国民间投资争端公约》(以下简称《华盛顿公约》),并根据该《公约》建立了“解决投资争端国际中心”(International Center for Settlement
当前,产品设计领域与人机交互领域前所未有地紧密结合起来,产品和交互设计的理论结构发展迅猛,涉及多学科、多领域知识的交叉研究和应用实践,给传统产品设计领域的设计教育和
电子信息制造业是国民经济战略性、基础性和先导性的支柱产业之一。而集成电路产业是战略性新兴产业的核心和基础,对促进社会信息化发展和提升综合国力具有重要的战略意义。20
西安地区唐墓壁画中有大量的官员服饰资料,本文以史籍考证为基础结合壁画中的实例材料,剖析官员朝服、袴褶服和常服的特点。同时探究官员服饰的文化特质,即它是大唐皇室既遵
<正>有这么一个故事:电视台一位编导F正绞尽脑汁地想选题,忽然看到一则"牛下蛋"的报道,如获至宝,好不容易获制片人批准,可拍马赶到发生地,一打听却傻了眼:牛下的不是蛋,是球
本文从敦煌158窟涅槃图像入手,分析了唐代社会割耳■面与刺心剖腹之风俗,认为割耳■面虽是北方游牧民族的一种葬俗,但在隋唐时期已为汉人社会所熟知和接受,同时也发展出明志
电子商务为供应链管理的集成提供了平台,本文分析了电子商务环境下供应链集成的必要性和可行性,提出我国企业实施供应链管理集成存在的问题及相应对策。
杰姆逊的这篇文章对西方电影理论影响很大,很多民族的电影理论工作者都注意到了这篇文章。中国作为第三世界,作为东方的一个大国,如何建立自己的话语体系,如何确定自己的电影
中国加入世界贸易组织标志着中国正式融入了世界经济体系,自此,中国的互联网企业得到了飞速而长足的发展。作为民营企业的重要组成部分,中国互联网企业长久以来也受到民营企业融
目前,交通拥堵问题日益严峻,已然成为制约城市社会经济发展的瓶颈问题。同时,由于对路网运行情况缺乏了解,引起路网中路段车辆分布极其不均,产生交通拥堵点、黑点,降低路网交通运行