一种基于共振峰恢复和 Mellin 变换的 非特定人语音特征提取方法

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户:ali5000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对非特定人语音识别中的声道长度归一化问题 ,首先研究了一种能够去掉基音激励的、基于自相关估计的共振峰 (Formant)频谱恢复方法 ,说明了不同说话人发同一元音时的频谱互为尺度化的关系 ,以及它们与同一说话人发不同元音时频谱的差别 ,然后结合具有尺度不变性的Mellin变换 ,提出了一种适用于非特定人的语音特征提取方法。在实验中 ,对从非特定人收集的 2 0个汉语元音 ,分别提取了其 FFT倒谱、Mel倒谱、FFT- Mellin倒谱及本文 Formant- Mellin倒谱 ,并用一种很直观的 F- ratio分辨率准则进行了性能评价。结果表明 ,无论是对纯净的 ,还是对带附加白噪声的发音样本 ,本文由共振峰恢复和 Mellin变换相结合得到的语音特征都具有较高的分辨率。 In order to solve the problem of channel length normalization in speech recognition of non-specific people, a Formant spectrum restoration method based on auto-correlation estimation, which can remove the pitch excitation, is studied. It shows that different speakers send the same vowel When the frequency spectrum of the same speaker is scaled, and the difference between them when they are different vowels from the same speaker, and then combining the Mellin transform with scale invariance, a speech feature extraction method suitable for non-specific people is proposed. In this experiment, we extracted the FFT cepstrum, Mel cepstrum, FFT-Mellin cepstrum and the Formant-Mellin cepstrum of 20 Chinese vowels collected from non-specific individuals, respectively, and used a very intuitive F - ratio resolution criteria for performance evaluation. The results show that the speech features obtained by the combination of formant restoration and Mellin transformation all have high resolution, both for pure and for whitened samples.
其他文献
针对弹道式运载火箭的弹道特征 ,利用参数化技术建立内弹道与外弹道弹道差之节省参数模型 .在此基础上 ,应用Bayes理论和数据融合方法 ,给出了一种能充分利用飞行试验数据和
目的 通过对细针吸取涎腺肿块细胞学图片的形态学分析,研究细针吸取细胞学在涎腺肿块中的诊断价值.结果 对180例涎腺肿块疾病患者行细针吸取细胞学涂片,用显微镜对涂片进行形
目的 探讨官颈癌及癌前病变筛查的可行性.方法 行程控超薄细胞检测系统(TCT)检查5545例,对其中307例阳性和219例阴性但临床可疑宫颈病变共计526例进一步行阴道镜及镜下取活检
目的:现察尿激酶型纤溶酶原激[活物(urokinase-type plasminogen aetiba-tor,uPA)和nm23-基因蛋白在乳腺癌组织中的表达及其临床意叉.方法:应用免疫组织化学SP法检测uPA及nm2
内脂素(visfatin)是新近发现的一种脂肪细胞因子,其反向转录cDNA序列与前B细胞克隆增强因子结构相同。它主要由内脏脂肪组织分泌,可结合并活化胰岛素受体,产生类胰岛素作用,
现代城市设计比较偏重形体艺术和人的知觉心理,其要素包括:建筑形态及其组合,土地使用、开敞空间、步行街(区)、使用活动、交通与停车、保护与改造、标志等。其中开敞空间(OpenS
在传统产业信息化建设中,矿山还相对比较落后,绘制各类图件多数还仅仅借助于CAD软件的开发和编辑环境来绘制。虽然商业化的地理信息系统已经应用到一些系统中,如MapInfo、MapG
研究了没有双交换作用的FeCr2 -xGaxS4材料的磁性以及CMR效应 .实验指出 :Ga对Cr的替代破坏了Cr亚晶格自旋的相互作用 ,使体系FM性增强从而导致Tc 提高 ,但PM到FM相变的幅度随掺杂逐渐降低 .ESR给出的微观磁性指出Fe ,Cr亚晶格自旋在温度低于Tc 时各自是FM排列 ,而两者之间是AFM排列 ,以致对未掺杂样品 ,体系的宏观磁矩M相互抵消 ,掺杂样品在T
计算机技术更新发展迅速,普通高校非计算机专业学生不仅要学习计算机知识,更要掌握基本的学习方法,形成终身学习的能力。通过应用范例教学的理论,精选“基础性”和“基本性”
在市场经济的激烈竞争下,企业以追求利润最大化,不断提高经济效益为主要目标。建筑工程项目成本的控制是施工企业降低成本,增加利润的有效途径,是提高企业管理水平,增强企业竞争力