声音诊断系统关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:harric1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过声音来诊断疾病的方法,近年来因为其有简单、方便、快捷且无需损伤受诊人机体和无需侵入式检查的的优势受到了广泛关注。目前关于声音诊断的研究虽然很多,但是却缺乏统一的采样流程和规范。许多研究还因为其样本集数量的不足,而缺乏说服力。甚至因为采样参数的不同,使得其研究成果无法被其他研究者重现。本课题主要围绕声音诊断系统的采集和分析技术展开研究,重点解决发音内容和时长,声音特征的选择和降维,声诊系统的采样频率和量化位数的选择等关键技术问题。确定规范化的样本采集流程,需要选择合适的采样硬件设备,主要包括麦克风和声卡等。采样过程还包括发音内容和发音时长的选择,本课题结合美国国家语音中心所推荐的元音发音,并考虑样本采集地人群的发音特点,选择了28个带有元音的发音内容。结合实际情况,选择了2秒发音时长。同时,将数据库中已有的疾病按影响发声的病理,分为神经类、肺病类和发声器官病变类三大类。为了确立声音诊断系统的采样频率和量化位数,对不同的采样频率进行了分类实验,结合其结果、运行时间和存储空间等因素,给出了推荐的采样频率为16kHZ和24kHZ。对不同的量化位数也进行了相同的分析,给出了推荐的量化位数为不少于16位。为了选择适宜的声音特征和降维方法,本课题对常用的声音特征进行了分类实验,结合实际对声音特征进行了取舍。其中,梅尔倒谱系数的分类准确率远远高于其它特征。还选择了7种不同的降维方法,通过分析它们不同的降维结果选择最适宜的降维方法即多式项核函数的主成分分析法。还对数据库中已有的各种疾病进行了分类实验,结合其结果和该病病理,分析了各类疾病的可分性。其中,帕金森的分类准确率达到87%以上,而心律不齐、糖尿病和肺癌的分类准确率也都超过80%。最后设计并实现了声音诊断原型系统,该系统包括高保真声音信号采集模块、病理特征提取模块、疾病分类模块、以及分析报告输出模块。目前该系统可针对神经类、肺病类和发声器官病变类这三大类疾病进行分析。
其他文献
自进入二十一世纪以来,我国人口老龄化现象加重以及现有医疗服务资源在城乡间分布不均匀,居民健康问题在我国受到的关注正在逐步加强。心脑血管类疾病更是危害现代人健康地工
目前,人脸检测是计算机领域重点研究方向之一,无论在科研领域还是商用领域都具有较大的研究价值。在科研领域上,检测问题是计算机视觉领域的一个基础性课题。人脸检测在人脸
机器人是人工生命中具有不少价值的应用实例,其中足球机器人是机器人的一个典型实例,本文以足球机器人作为多人工生命体的研究平台。足球机器人系统是一种移动机器人系统,其
随着网络技术的飞速发展,视频会议、远程教育、网络游戏等实时业务的兴起对网络的承载力提出了更高的要求,组播通信的方式成为支持多媒体业务的主要形式。不同的实时业务对Qo
非单调逻辑是人工智能研究领域的一个重要方向,为不同的逻辑规则提供相应的语义特征(即,建立表示定理)是非单调逻辑研究中的重要内容之一。占优后承是非单调逻辑中研究和应用
随着信息技术、计算机技术的迅速发展,数字化办公已经在军事、政府、企业等部门和单位得到了广泛的应用。数字化办公可以提高工作人员的办公效率、优化办公成本、为企业带来商
随着互联网技术的发展和人工智能技术的进步,政府管理也正在从传统的管理时代迈向网络化的智能管理时代。以往电子政务平台所提供的简单功能已经不能满足日益发展的社会需要,
Internet构成了逻辑上的信息世界,改变了人们的沟通方式。本文中的Internet均指以太网。无线传感器网络(wireless sensor networks,简称WSN)是最新产生的一种以传感器技术为
随着三维数据获取技术的不断发展,使得人们可以快速有效的获取现实世界中物体的高精度表面模型。这极大地促进了三维点云模型在模式识别、三维重建、模型分割等领域中的广泛
入侵检测技术以其能够收集分析网络中关键点的信息、发现违反安全策略的行为,得到广泛的研究和应用。然而,入侵检测系统的报警存在的误报率、冗余率偏高、可扩展性差、报警层