与文本相关的说话人识别方法研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:xieym28
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别作为语音识别的一种特殊形式,是当前语音信号处理技术的研究热点之一,该技术对于各类机要场所、安防等领域的身份认证具有重要的应用价值。 本文首先根据语音信号的物理产生过程以及人耳的听觉特性,介绍了两种系统模型,分析和提取出了几种应用较为广泛的说话人特征参数。其次,分别以连续隐马尔可夫模型CHMM及BP网络为例,详细阐述了隐马尔可夫模型HMM与人工神经网络ANN两种不同的建模理论与识别策略,讨论了二者在说话人识别当中的一些应用问题,构造完成了两类不同的话者识别模型,并编程实现了相应的识别算法。接着,在特征提取方面尝试了一种较新的组合形式,仿真实验结果表明将多种特征参数进行合理组合有助于提高说话人识别系统的正确识别率。最后,在不增加网络设计、构建方面的困难与复杂度的情况下,考虑如何将规模庞大的多维多帧说话人语音特征矢量送入人工神经网络进行训练,同时又保证所训练出的网络具有较高的识别性能,针对这一问题本论文给出并应用了一种新颖的特征参数处理方案。该方案以说话人声音特征参量各维的变化情况来反映该讲话者声音特性的变化,一定程度地降低了神经网络结构的复杂性,较好地解决了网络设计当中面临的一些实际问题。 在对以Mel倒谱及其差分形式为组合特征参数的仿真测试中,本论文采用上述特征参数处理方案建立了—BP网络,在训练过程中时
其他文献
异向介质是一种介电常数和磁导率同时为负数的介质。异向介质是当前国际电磁科学研究的热点,对于异向介质以及基于异向介质的新型微波器件的研究,有着重要的意义。 本文采用
随着社会的发展,日渐国际化的社会对英语口语方面的人才产生大量需求。为了提高英语口语能力,国家对教师与学生都提出了明确的要求。但是在实际生活中,由于长期背负着考试压力和
粒子物理实验中数据传输的方式有很多种,总结各种数据传输方式的特性。根据粒子物理实验中高能数据传输的需求,对应不同部分和系统采用不同的数据传输方式,使得粒子物理中的高能
microRNA(miRNA)是一类长度大约为22nt的单链非编码RNA,在很多生物学过程中起着重要的作用,像细胞分化、增殖、凋亡等等。miRNA在转录后水平调控着多个蛋白质的表达,从而在癌症
药物成瘾是一种原发慢性的神经精神疾病,伴随有基因、精神、环境等因素的影响。行为学表现包括以下一种或者更多的特征:对过量使用药物的控制能力的损害,强迫性的用药,药物造成机
随着信息技术的发展和计算机视觉理论的成熟,视觉监控的应用越来越广泛,数字监控系统也将逐步取代传统的模拟监控系统。目前,自动车辆识别系统AVC(AutomaticVehicleClassificati
全球定位系统(Global Positioning System, GPS)自二十世纪七十年代建成以来,经过二十余年的研究与发展,已成为世界范围内技术最成熟、使用范围最广的卫星导航定位系统,深刻影响
赭曲霉毒素A(Ochratoxin A, OTA)是由曲霉属(Aspergillus)和青霉属(Penicillium)真菌产生的次级代谢产物,它是食品和饲料中的主要污染物之一,经常出现在各种各样的食物中,包括谷类、咖
高品质的电力供应一直是全球各国共同追求的目标。要达到这一目标,单纯提高电力供给能量是不够的,更重要的是抑制谐波对公共电网的污染、提高功率因数,使有限的电能得到更加充分的利用。对于数量众多而且分散的中小功率电源系统,有源功率因数校正(APFC)电路以其体积小、重量轻、功率因数高等优点而倍受青睐。本论文以“基于BCD工艺的AC/DC关键技术理论研究与设计”科研项目为背景,主要工作是设计一款宽电源电压范
围绕学科发展前沿领域和国家目标,中国科学技术大学基础等离子体物理实验室研制了某型号外热式等离子体实验装置多路探针诊断系统。此实验装置的研制和应用,将有力地推动低温等