基于声音的病例特征提取与分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:z957558481
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相比于现有的诊断技术,无损非侵入式的声音诊断技术,近年来受到学术界的持续关注。但目前各种声音诊断研究中采集设备多种多样,采集流程各有差别,然而关于采样流程中的因素和分类准确率的关系的研究十分稀少。实际上,声音诊断技术目前仍处于起步阶段,亟待解决其采集过程中的标准化客观化问题。本课题的研究内容主要是围绕客观化采集流程规范以及病理特征提取和分析来展开。为建立客观化的采集环境,本课题设计了包含隔音室,麦克风和声卡的声音诊断系统。采集环境中的噪音十分影响采集到的声音的质量,因此隔音室用于降低噪声,减少量可达40分贝。提出的麦克风和声卡的选型指标保证了采集的声音信号不失真。参考对比已有实验的采集流程,文中建立了采集流程规范以保证流程客观性。根据汉语语音特点以及采集地区的具体情况,确定了语音采集的具体发音内容。该发音内容包含汉语的全部单元音以及大多数汉语辅音类型,确保采集到的语音覆盖大部分发音器官,能记录到因发音器官病变而产生的声音变化。在完成发音流程及内容设计之后,于中医院采集了频率为192 kHz或者96 kHz的声音样本,其中用于分类的样本有101人次2828例,主要包括健康人声音样本、帕金森病人声音样本、肺癌病人声音样本和声带疾病类病人声音样本。基于这些样本,我们探讨了不同采样频率的基音频率和GCI序列的差异以及声音特征和融合特征在不同采样频率下的分类准确率。实验表明,对帕金森疾病而言,当采样频率在16 kHz及以上时不同采样频率下的基音频率以及GCI序列差别不大。当使用全部特征时,帕金森声音在8 kHz时分类效果显著下降,肺癌声音或者声带类疾病声音在16 kHz及以下采样率时分类效果显著下降,而三类声音在其余采样频率下分类效果相差最大仅为3%,其中最高分类准确度分别为89%±3%、87.50%±2.2%和84.23%±2.9%。综合考量存储空间、特征计算速度以及分类准确度,确定最佳实用采样频率在24 kHz左右。由于分类疾病为典型的神经系统疾病,肺部疾病以及声带疾病,因此我们推出该结论对主要影响这三个器官的发音系统疾病也具有参考意义。
其他文献
谓词加密算法是可搜索加密算法领域的研究热点,提供了外包数据的密文查询功能。谓词加密算法中假设外包方(例如云服务商)会正确地执行查询算法,并将真实的查询结果返回给用户
互联网上存在海量的网络资源,如何有效利用、开发这些资源是当前的一个研究热点问题。随着企业竞争越来越激烈,诸多业务要求在较短时间内汇聚网络上的网络资源以求解业务问题
信息化是当今社会发展的趋势,随着计算机、通讯技术与医疗影像科学在医疗行业的进一步应用,我国医院信息化管理进程得到不断深入和拓展。国内部分医院已经建立起了独立的医院
代码变形技术是软件保护技术的关键技术之一,属于针对逆向工程与加密技术互补的安全分支。代码变形技术按照类型分为词法变形、数据变形和控制流变形。本文主要研究了基于控
随着互联网的不断发展,在线数据库的数量不断增多,DeepWeb模式集成的重要科学研究意义和显著的工程应用价值就凸现出来,但是由于这些数据库在地理上分布、管理上自治、模式上
随着文本数据的急剧增长,文本聚类方法已成为大家关注的热点。文本数据常用文档-词矩阵表示,基于这种表示方法大多数传统的聚类算法采用单向聚类方法,即要么只是对文档进行聚
自动图像标注是基于内容图像检索中重要而具有挑战性的工作,它可以在一定程度上解决基于内容图像检索中存在的语义鸿沟问题。如果能实现自动图像标注,那么现有的图像检索问题
近些年来,数据挖掘技术获得了人们越来越多的重视,因而成为一门新兴的学科,人们利用数据挖掘技术从海量的数据中寻找有用的信息,同时为了使数据挖掘系统发现知识的过程和结果
随着互联网的飞速发展,网上购物也变的越来越普及,给用户推荐合适商品的推荐算法也变的日益重要。频繁模式是指频繁地出现在数据集中的模式,可以作为推荐系统推荐依据的一部
随着信息技术的迅猛发展,参与到社交网络的人越来越多,人们乐于在网络中去分享信息,拓展自己的人脉,企业也能通过社交平台去直接影响客户。在线社交网络已经成了人们生活中密