论文部分内容阅读
随着社会不断进步、经济发展以及随之而来的生活改善和节奏加速,人们的语言交流活动日益频繁,常见嗓音疾病的发生率呈明显上升趋势。在嗓音医学这门新兴的专科医学领域中,基于嗓音声学评估方法并利用信号处理手段去识别病态嗓音的研究已逐渐成为一个多学科交叉领域的前沿热点。病态嗓音识别包括嗓音信号特征提取和嗓音样本分类识别两部分。本文分别利用人工神经网络(Artificial Neural Network, ANN )和支持向量机(Support Vector Machine, SVM)分类器,使用了美国麻省眼耳科医院(Massachusetts Eye and Ear Infirmary)语音嗓音实验室公开数据库中177例混合型常见病嗓音样本和39例正常嗓音样本数据,进行了模式分类识别算法研究。本文分别设计了两种分类器的算法实验,分析了其嗓音样本分类识别的可行性。ANN算法实验中,针对隐含层数、隐含层节点数以及训练函数类型等网络结构参数的选取,进行了讨论和分析;SVM算法实验中,针对核函数的类型选择及其参数的优化,也做了相应的讨论和分析;最后比较了两种分类器受样本的影响程度和识别率的稳定性。本文研究结果表明,ANN和SVM两种分类器均适用于病态嗓音样本的模式分类,并都能获得较高的正确识别率。但ANN的网络模型设计和结构参数选取往往需要较多的训练与实践经验才得以达到最优效果;另外与SVM相比,ANN对训练样本更为敏感且稳定性略差(方差0.02);因此,ANN主要适用于信号离线处理研究。而本文通过网格枚举法得到SVM训练建模的核函数优化参数,使其最终识别率有很好的精度(89%)和稳定性(方差0.003)。因此,SVM分类器则更适用于需要实时快速地在线处理嗓音信号的场合。