基于改进特征值的语音关键词提取

被引量 : 0次 | 上传用户:wangzhy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术和媒体应用的迅速发展,网络中的影音资源所占的比重越来越大。传统的文本检索已不能满足人们需要,视频检索由于数据量大而得不到应用,语音检索就显示出重要的研究价值。语音检索的核心问题是语音关键词的提取,语音关键词提取衍生于语音识别。语音识别也被称为自动语音识别(Automatic Speech Recognition, ASR),是将人的说话语音内容转化为计算机能够处理的形式。语音关键词提取是建立在语音识别的基础之上,对语音识别的结果进行进一步分析,从中提取能够反映语音内容或主题的代表性词语。语音关键词提取是语音检索的核心技术之一,具有重要的意义和研究价值,成为近几年的研究热点。本文主要研究的是在非限定说话人和非特定任务的情况下进行的,通过基于大词表(Large Vocabulary)的语音识别技术,利用词混淆网络(Word Confusion Network, WCN)并结合文本检索的相关技术来提取语音文件中关键词。本文首先阐述了语音关键词提取的意义及其研究现状。然后介绍了语音关键词提取的相关技术,如语音的时域和频域特征、声学模型和语言学模型等。接着从语音分割、语音识别、混淆网络的生成、关键词的提取和置信度确认等几个方面分别进行了详细论述。在语音分割模块,本文对传统的特征值进行改进,得到区分度更好的特征值,如将短时能量改进为低短时能量比率。利用改进之后的特征值进行语音分割,提取出语音信号中的对话部分。在关键词提取模块,系统对语音识别模块得到的网格做进一步处理得到词混淆网络,利用词混淆网络进行关键词的搜索,最后对搜索结果进行置信度确认,得到最终的关键词输出。实验结果表明,基于改进特征值分割后的语音识别的结果比未分割的有所提高,系统的关键词检测率也达到73%左右。
其他文献
随着社会的不断进步,基础建设和更新速度加快,建筑业支柱产业地位日益凸显。与此同时,每年建筑施工和拆除过程产生数亿吨的建筑废弃物。为避免环境污染和资源浪费,建筑废弃物资源
目的维生素D是人体重要的内分泌激素,不仅对于维持血清钙磷浓度的稳定等具有重要作用,还具有减少心血管疾病、降低肿瘤发生等多种作用。近期更有文献报道重症疾病的患者维生
【背景】汉坦病毒感染可引起两类不同的严重感染性疾病,即肾综合征出血热(Hemorrhagic fever with renal syndrome,HFRS)和汉坦病毒肺综合征(Hantaviruspulmonary syndrome,HPS)。其
唾液腺腺样囊性癌(salivary adenoid cystic carcinoma, SACC)是一种较少见的恶性肿瘤,嗜神经侵袭被看做是它的主要特性之一,这一特性使得其在临床手术中不易切除干净,致使癌细胞
科技的飞速发展,计算机技术的迅速更新,网络化和信息化程度的不断提高,方方面面都预示着人类社会正在步入一个以电脑科技为依托,仰仗多种媒体共同处理、传播信息的全新的时代。多
新帝国主义是围绕资本主义生产机制而不断演变的复杂时代景观,它展示出资本主义不断打破内部发展空间的束缚与禁锢,能够在经济危机的爆发与拯救中来回穿梭,从而具有盘活自身
在全球化不断发展的今天,国家之间的竞争终究是人才的竞争。大学生是国家人才发展的基础和希望,现代企业对员工领导力的要求越来越高。学校是社会的缩影,是学生认识现实的场
利益集团是介于国家和个人之间的中观组织。一项好的、“合意”的改革能否得以推行,往往并不仅仅取决于其对效率的改进,更重要的是取决于支持和反对力量的对比。在中国渐进式改
世选制作为辽代的核心政治制度产生于契丹部落联盟时期,是当时家族势力崛起与传统军事民主制相互作用的结果。辽建国后,作为家族间权位分配手段的世选制被继承并保存下来。但是
股票期权发端于美国,由我国在90年代中后期引入并进行试点,随着此后陆续出台的相关法规以及指导性文件,我国的股票期权法律制度逐步形成。然而无论是这一法律制度自身还是在