【摘 要】
:
基于语音对阿尔兹海默病进行识别被证明是一种有效的方法,相较于脑影像和量表,语音更具有经济性和可扩展性,能够适应大规模检测。目前的研究方法较多的采用降维-分类的方式进行,即将语音(通常在10万维以上)表示为低维的特征向量(通常在100维以下),再进行分类获得疾病识别结果。在特征表示方面,研究人员尝试使用局限性更小的内容无关(Content-independent,CI)特征来表示语音,但是传统的特征
论文部分内容阅读
基于语音对阿尔兹海默病进行识别被证明是一种有效的方法,相较于脑影像和量表,语音更具有经济性和可扩展性,能够适应大规模检测。目前的研究方法较多的采用降维-分类的方式进行,即将语音(通常在10万维以上)表示为低维的特征向量(通常在100维以下),再进行分类获得疾病识别结果。在特征表示方面,研究人员尝试使用局限性更小的内容无关(Content-independent,CI)特征来表示语音,但是传统的特征表示方法缺乏任务导向性,导致在降维的过程中丢失大量与任务相关的信息。本文从任务导向出发,使用度量学习方法改进语音的特征表示过程,提升阿尔兹海默病在CI特征上的识别准确率,同时通过可解释性框架,在模型相关和特征相关两块对特征表示方法进行解释。本文主要的工作贡献如下:(1)本文提出了任务导向的语音特征表示方法,通过使用度量学习框架,让编码网络学习到任务相关的信息;引入动态边界(Dynamic Boundary)改进了triplet loss,提出了基于DB-triplet loss的度量学习模型,提升特征表示的准确度。在ADRess2020的阿尔兹海默病分类的数据集上,本文的特征表示方法在五种模型上超越了所有声学特征表示方法,在部分模型上超过了语言学特征表示方法,并且在决策树模型上获得了83.3%的准确率。(2)在早期阿尔兹海默病识别任务上,本文提出了多目标任务导向的语音特征表示方法。本文以样本类别学习作为一个目标,将多类别学习的任务拆分为多个单一类别学习目标,在多个目标上训练多个模型来提升模型学习的专注度,并引入极坐标改进统一度量损失函数,使用Sphere loss对编码网络进行训练,通过层次结构来帮助模型更精准的分类。该特征表示方法在实验比对上超过了单目标任务导向的方法,在与语言学特征组合成的混合特征表示方法上,获得了在同类特征比较实验中最佳的效果。(3)在可解释性上,本文通过t-sne可视化模型,在模型训练过程中对特征进行可视化,发现模型在训练过程中,特征向量分布呈现聚簇趋势。在特征解释方面,本文使用SHAP框架对特征的局部信息和全局信息进行分析,获得特征对结果的贡献细节和重要性排名,基于这个排名,本文使用Grad-CAM框架针对重要性较大的特征生成对应的热力图,对热力图中颜色较深的语音片段进行分析,获得对应特征的解释结果,帮助更好的理解本文的模型。
其他文献
金属3D打印技术强大的加工制造能力,及快速、轻量化的特点为武器装备的维修保障提供了新的思路,这项技术的推广应用将大大提高装备维修保障的效率。金属3D打印由于加工原理的制约,目前很难达到较高的加工精度,本质上得到的是相当于精密铸造的毛坯件,为了保证零件精度要求,3D打印件往往需要进行车、铣、磨等机加工后处理过程,这也是3D打印技术融入工业制造领域的一个重要技术环节。由于金属3D打印精度受多种因素制约
通过利用大数据爬虫技术在电商网店中爬取某个商品的好评或差评大数据后,预处理爬取的评论使非结构化的数据去掉重复数据和无效数据,对处理后的数据进行分词、词性标注,去标点符号、去停用词处理,把非结构化数据转变为结构化数据,对评论数据采用算法构建模型并分析。采用基于决策树情感分析、情感词库分析、LDA模型的主题分析,综合3种方法对评论数据进行处理,得到一份最终的情感分析,从而得到消费者偏好的产品方向,以便
科创企业以科技创新为核心,研发能力强,盈利能力稳健向好。科创企业评估有利于市场监管从而促进高质量科创企业的健康发展,更好的服务国家科技创新战略,促进经济高质量发展。目前,有大量机构和分析师研究科创企业,并发布内容专业、信息可靠的科创企业研究报告。金融从业者需要花费大量时间定期撰写科创企业评估报告,没有时效性,并且撰写的评估报告没有统一的评估指标体系,评估指标片面,格式不统一。因此,从大量科创企业文
在弹群连续打击条件下的反舰导弹目标动态分配问题是未来海上战斗中需要重点关注的问题,它主要包括导弹目标连续分配和导弹协同攻击两方面内容。本文在分析总结国内外研究现状的基础上,针对在弹群连续打击条件下的导弹目标动态分配问题,以寻找低复杂度的解决方案、建立包含多约束的导弹目标动态分配模型、寻找合适算法求解为目标,从问题模型和求解算法两方面进行了研究,具体工作如下:1、针对导弹目标动态分配问题,研究和设计
推荐系统能够预测用户对物品的潜在兴趣,在当今的在线平台上得到了广泛的应用。序列推荐在在线服务(如电子商务)中具有很高的实用价值,因此吸引了越来越多研究者的研究兴趣,序列推荐的基本目标是捕捉项目转换相关性。用户当前的兴趣随着其历史行为演变,这使得平台很难做出适当的建议。因此有必要描述用户历史记录的演化模式,对用户在项目上的事务的序列模式进行建模。通过这些用户表示,可以轻松地为每个用户推荐合适的项目。
在房地一体项目测量过程中应用传统的测绘方法,时间周期长、操作流程复杂、效率低,而无人机倾斜摄影测量技术效率高、受起降场地和天气影响小、精度高,在房地一体项目测绘过程中优势明显。本文利用无人机倾斜摄影测量方法、传统测量方法分别对万安镇天地庙村进行不动产测绘,并将两种测量方式的精度指标进行对比分析。实验结果表明:无人机倾斜摄影测量外业工作量小、效率高,且精度满足山西省相关技术规范要求。
大规模多输入多输出(Multi-input Multi-output,MIMO)系统在基站处配置大规模天线阵列,显著提高了频谱利用率及链路可靠性。然而,信号检测技术涉及大量的复杂矩阵运算,随着MIMO系统规模的扩大,信号检测面临复杂度和精确度的双重挑战。因此,研究低复杂度高精确度的大规模MIMO信号检测算法对于未来通信发展具有重要意义。针对这些问题,本文做出了以下工作:1.针对现有交替方向乘子(A
深度学习技术的迅速发展使得这一技术被广泛应用于各个领域,包括基础现实应用以及许多与安全相关的任务应用,这使得深度学习模型成为攻击者的目标。攻击者根据深度学习模型的脆弱性定制了相应的攻击策略。这种由模型暴露出的弱点衍生出的对抗攻击算法对图像分类领域的发展提出了挑战,同时它也为进一步探索深度神经网络提供了机会。在攻击者的推动下,越来越多的防御机制被提出来保证深度学习模型的安全。本文分别从防御机制的两个
本文主要研究了基于RGB-D相机的救援机器人语义建图方法,以及语义SLAM与导航算法相结合的相关技术。传统的SLAM算法在建图时只考虑环境的几何特征或者纹理特征,这使得救援机器人只能根据环境的浅层信息进行导航和探索,难以完成复杂的自主探索任务。语义SLAM可获取环境的语义信息,并将语义信息与环境地图相结合,帮助机器人从更高的层次去理解周围环境,进而丰富导航方式,使机器人能够完成复杂的自主探索任务。