面向自闭症儿童早期筛查的声学特征提取与分类模型研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:xiaoxiaolong1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
儿童自闭症是一种广发性发展障碍疾病(pervasive developmental disorders,PDD),其共同特征为言语发育障碍,社会认知障碍和行为方式刻板重复。具体表现在三个方面:一是患者极少主动沟通,答非所问;二是患者对周围人群或事物不感兴趣,难以体会他人情感;三是患者行为方式单一,受到刺激很难快速做出改变。3岁前是儿童自闭症高发期,以男孩居多,病因主要集中在家族遗传史、妊娠期发育不良、大脑功能区发育不健全等方面。据相关统计显示,在全球范围内,自闭症儿童的数量以20万/年的速度增长,而在中国,儿童自闭症已被列为精神残疾类疾病首位,儿童自闭症的诊疗研究已逐渐成为全球性的研究课题。目前,常见的辅助诊断方式有脑CT扫描、脑电信号描记、眼动追踪、行为分析(Applied Behavior Analysis,ABA)以及多量表综合汇评等,多数医生还是依据长期的临床观察辅以多种量表进行诊断。由于没有制定出行之有效的客观评估方式,导致诊断周期过长,诊断的准确性较低,容易错过最佳的干预时期。声音是人类生活中信息传递最常见的载体之一,由于每个人发声器官构造上的差异,不同人发出的声音信息会略有不同,因此,通过对采集到的声音进行音频分析,往往可以找出某些只属于本人的特定信息,方便研究和总结规律。为找到一种客观真实的自闭症诊疗手段,本文从自闭症儿童声学角度出发,收集尽可能多的自闭症儿童发声数据,利用机器学习和音频信号分析的技术,经过全面的对比实验,提取最具有代表性的声学特征参数和筛选最合适的的分类模型,搭建音频分析与识别框架,为自闭症儿童早期的临床诊断提供了一种声学检测手段,本文主要开展的工作内容如下:(1)自闭症儿童声音数据的采集与制作。由于受到复杂噪声环境的影响和对自闭症儿童缺乏了解,导致采集范式设计不合理,再加上家长与儿童的不配合,使得前期采集到的数据质量较差,课题的开展受到严重阻碍。随后与安徽医科大学儿童科的医生们展开合作,由他们联系和安抚患者家属,我们使用改进后的录制范式来采集发声数据,后续通过简单地指导和培训,医护人员已经可以独立进行采集工作,解决了我们因为路程较远而无法经常采集新数据的难题,经过双方通力合作,为日后建立完善的自闭症儿童发声数据库奠定了基础。(2)音频信号前端预处理算法研究。通过对自闭症儿童音频信号和高斯噪声进行加噪建模,以此为基础,确定了适用于本文数据库的音频去噪和端点检测算法,在音频去噪方面,对多窗谱减算法的去噪性能进行了研究,实验表明,该算法在抑制环境噪声的同时可以极大消除去噪过程中附带的“音乐噪声”,在不同信噪比下均表现出良好的鲁棒性。在端点检测方面,对比分析了五种端点检测算法,并通过比较与实际标定位置之间的误差,最终得出基于多窗谱减的均匀子带谱熵具有最优的准确性与鲁棒性。(3)基于优化算法的支持向量机模型研究与声学特征提取。首先引入混淆矩阵的概念,并使用F1-Score、AUC、Accuracy、Time四种性能评价指标,分别对基于网格、遗传和粒子群三种优化算法的支持向量机(Support Vector Machine,SVM)模型进行综合评估。实验结果表明,网格算法搜索时间最短,粒子群算法识别精度最高,而遗传算法的效果最差。最后使用网格和粒子群优化算法对感知线性预测(Perceptual Linear Predictive,PLP)、梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)、线性倒谱预测系数(Linear Prediction Cepstrum Coefficient,LPCC)和小波梅尔倒谱系数(DWTMFCC)四种声学特征进行准确性和鲁棒性对比,最终得出,在理想环境下,PLP与MFCC均具有较高的准确率,而在低信噪比环境下,PLP稳定性能最好,DWTMFCC次之。(4)基于卷积神经网络识别模型研究。鉴于音频信号一维特性,对二维卷积模型进行改造,建立更适用于音频检测的一维卷积模型,并与传统二维卷积模型在识别性能、抗噪性能和收敛速度三个方面进行对比。实验结果表明,一维卷积模型在低信噪比下的抗噪性要优于二维卷积,在收敛速度上,一维卷积下降更快,在识别性能上,也是一维卷积模型识别率更高。总体来看,一维卷积模型在音频信号分类识别和抗噪性的表现均优于传统的二维卷积模型。(5)基于SVM的自闭症儿童音频检测系统。在总结研究音频信号前端预处理、声学特征提取及模型优化算法的基础上,实现了基于Matlab2012a平台开发的支持向量机自闭症儿童音频信号检测系统,主要集成了音频采集与录制、前端预处理与分析、模型训练、特征提取和分类识别等功能模块,在复杂环境下,表现出较好的适应性和稳定性。
其他文献
研究背景和目的:准确的肿瘤分期系统不仅可以判断患者的预后、帮助患者制定最佳的治疗方案,同时有助于研究者交流信息以及设计相对标准的临床试验研究。然而,遗憾的是,尽管目
目的:探讨影响结直肠癌(CRC)肺转移患者生存预后的相关因素。方法:回顾性分析2013年1月至2017年11月间,在福建医科大学附属肿瘤医院胃肠肿瘤外科收治的100例CRC肺转移且原发
在中国近代史研究中,传教士的在华活动日益受到学界的重视。英国浸礼会传教士李提摩太在华四十五年,不仅致力于传播福音、还积极传播西方科学知识。他还通过撰文论说与结交权贵,呼吁中国进行改革。由李提摩太在《时报》撰写的文章收录而成的《时事新论》,就是他最重要的代表作。李提摩太在来华早期就通过传教、赈灾与讲学的经验撰写了很多呼吁中国改革的文章。在主笔《时报》后更是笔耕不辍。《时事新论》收录的文章,涵盖了一系
头晕和眩晕是许多疾病的常见临床症状和典型症状。在我国人口众多、老龄化加剧的社会中,头晕和眩晕的患者数量日益增加。在头晕、眩晕的床旁检查中,眼球震颤是前庭病变最敏感、最具特异性的体征。通过临床采集的眼球运动视频测量眼球震颤模式,可为头晕和眩晕的诊断提供有价值的参考依据。然而上述过程仍依赖于专家和专科检查,无法实现智能化眼震模式识别及床旁诊断。良性阵发性位置性眩晕(BPPV)是极为常见的眩晕病,旋转眼
进入二十一世纪以来,为了适应时代的变迁,酒店行业中的主题酒店悄然崛起。但是,我国主题酒店的发展较慢,整体相比较国外比较落后,没有积累足够的经验,并且没有对设计进行创新,也没有运用个性化风格,出现了酒店整体设计水平较低的情况,导致我国的酒店行业呈现出参差不齐的发展状况。本论文以郑州巩义豫見主题酒店室内空间设计为载体,将巩义地域文化元素运用在主题酒店空间设计中。本论文对主题酒店的相关理论进行了概述和分
无机铅卤钙钛矿CsPbX3(X=Cl,Br,I)由于具有较大的吸收截面、高效且可调谐的光致发光、长的电子-空穴扩散长度和低的陷阱态密度而成为优异的光子和光电材料,在发光二极管、太阳
佛教約於公元一世紀傳入中國,大規模的譯經活動也隨之展開,大量梵語佛經陸續被翻譯成漢語,一直持續至北宋時期。佛經翻譯是中國翻譯史上的第一次高潮,十個多世紀間,形成了豐富的漢譯佛教經典。綿延千年的佛教经典翻譯工作擴大了漢語的詞彙量,豐富了漢語的語法表達,對我國的語言、文化產生了深遠的影馨隨著對佛教漢語的深入研究我們發現許多語言事實和現象源自原典。因此,開展基於梵漢對勘的漢譯佛經語言研究,對幫助人們更好
基于大量空气质量微型测控站和国家测控站所构成的空气质量监测网络在科学有效治理空气污染方面发挥了积极作用。与此同时,密集的网格化监测也产生了大量宝贵的数据有待分析和挖掘。网格化监测所采用的大量微型测控站具有价格低廉、精度不足、传感器故障多的典型特征,导致某些微测站存在监测数据异常和不稳定的问题,以及部分区域未设国测站数据校准的挑战。针对微测站存在的上述难点问题,本文从数据驱动的角度来分析和挖掘历史监
铁路多经企业,也称铁路非运输业,是由铁路出资经营的国有企业。铁路多经企业不同于传统运输业。多年来,铁路多经企业一直依托着铁路运输业发展,企业内部管理混乱、发展定位不清晰。直到2014年,国家对铁路实施改革,铁路多经企业逐步走向市场化。面对改革冲击,铁路多经企业急需通过改变去适应时代发展。大连A集团是沈阳局集团公司(原沈阳铁路局)下属多经企业代表,集团成立于2005年,主要业务为酒店餐饮服务、物流仓
荧光成像技术因其实时、无创、高空间分辨率等优势,已成为生命进程可视化的有力工具,特别是近红外荧光发射极大地促进了分子过程的体内成像。近红外荧光探针在体内外追踪分子