基于语音信号的抑郁倾向识别研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:fh1130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抑郁症是一种常见的精神障碍,其主要特征为情绪低落、兴趣减退等。由于其较高的患病率和复发率,引起公众的广泛关注。目前,抑郁症的检测方法主要是基于经验丰富的医生的诊断和抑郁量表,这些方法都过于主观且相对不够准确。再加上人们对于抑郁疾患的偏见,使得抑郁症的就诊率和治疗效果都比较差。为此,找到一种客观、有效且适用性高的抑郁症检测方法显得尤为重要。语音以其非侵入,低成本,易获得等特点,使基于语音信号的抑郁识别建模研究逐渐成为学术界的研究热点。大量的研究发现,与正常群体比较,抑郁症患者在语音声学特征方面存在音调较低、语速较慢、语调单一和停顿较长等特点,可以作为抑郁症检测的客观指标。由于抑郁倾向属于抑郁症的前期表现,且抑郁倾向个体在当下社会生活中比抑郁症患者占比更高。因此,若能对抑郁倾向个体早期干预并进行情绪调节,便可以降低抑郁症的患病率。基于此,本文首先从心理学视角,建立抑郁倾向语料库,其次运用卷积神经网络算法解决抑郁倾向个体的识别问题,最后针对数据量少的问题,采用数据增强等方法进行数据扩充。本文的主要研究内容和创新如下:1.采集抑郁倾向语料。从心理学角度出发,利用心理学经典范式,设计了文本朗读(词汇朗读和短文朗读)、访谈和图片描述三种言语方式。每种言语方式包括正性、中性和负性三种情绪刺激(短文朗读只有中性情绪)。录制了50名在校大学生的语音数据,每名被试10段语音,共计500段语音,以此构建了抑郁倾向语料库。2.实现基于语音信号的抑郁倾向识别。本文将语音转化为语谱图,将语谱图作为卷积神经网络的输入实现基于语音信号的抑郁倾向识别研究。在此基础上,主要研究不同言语方式和不同情绪状态对分类的影响,并对整体、男性和女性语音分别进行实验。实验结果表明,在不同言语方式下,自发语音识别效果高于朗读语音,整体实验中图片描述的识别效果最好,男性和女性实验中访谈的识别效果最好;在不同情绪状态下,整体和女性实验中负性情绪的识别效果最好,而男性实验中中性情绪识别效果最好;在所有言语方式和情绪状态下,女性的识别效果都明显高于男性。3.扩充抑郁倾向语料。为了解决实验数据量较少带来的问题,本文采用两种数据扩充方式增加数据量:(1)在抑郁倾向语料中加入悲伤、焦虑和恐惧三种最接近抑郁倾向语音的负性情感语料;(2)对抑郁倾向语音的语谱图进行图片的数据增强,使得在较小样本的数据集上可以达到更好的分类效果。实验结果表明,在抑郁倾向语料中加入负性情感语料以后识别率并没有明显提高,但进行图片增强以后识别结果提升了7.63%。
其他文献
为了探究北方城市常见绿化树木落花循环再利用的潜力,本研究以樱花(Cerasus sp.)、海棠(Malus spectabilis)、白玉兰(Magnolia denudata)、紫玉兰(Magnolia liliflora)、桃花(Amygdalus persica)、红叶李(Prunus cerasiferaⅠ)、紫叶李(Prunus cerasiferaⅡ)、含笑(Michelia figo
下一代无线通信网络需要满足互联网访问、在线游戏和多媒体应用程序的高数据速率需求。在这些高数据速率下,节点上的能源消耗很高,这又导致温室气体排放量增加。通常建议使用能量收集(Energy Harvesting,EH)作为此问题的解决方案。可以从几种不同的可自由获取的环境资源(例如风,振动,热,太阳能和环境射频(Radio Frequency,RF)信号)中收集能量。但是,由于自然环境的间歇性和随机性
随着计算机技术的发展,人机交互成为了融合物理世界和信息世界的关键,身份识别为人机交互的安全性提供了保障。近年来,研究人员相继提出了多种实现身份识别的方法,比如为可信人员佩戴专用的身份识别卡、借助专用传感器,通过指纹、面部、虹膜等生物特征来确定人员身份、基于无线保真技术(Wireless-Fidelity,Wi-Fi)识别人员身份等。其中,Wi-Fi环境下的人员身份识别方法因具有不需要使用者佩戴额外
伴随着无线技术的不断发展,无线设备的迅速增多,不同的无线通信设备对频谱的需求出现了指数级增加,无线电频谱资源得不到有效地利用已成为主要问题。认知无线电技术可以通过对周围环境的学习,实时调整参数而达到高效利用频谱资源的效果。频谱感知技术作为认知无线电技术的先决条件被越来越多的专家学者所关注。本论文主要对基于发射机感知的认知无线电频谱感知算法进行研究。首先对基于发射机感知的能量检测算法、匹配滤波检测算
抑郁症,又称抑郁障碍,是一种严重的心理障碍疾病。其在临床上表现为显著且持久的心情低落、愉悦度降低、言语活动减少等,具有自杀倾向,严重影响人们的身心健康,也为社会带来了巨大的危害。截止2017年,全球有3亿人患有抑郁症,我国的抑郁症患者也已超过5400万人。当下,抑郁症的诊断方法以主观量表为主,依赖医生的临床经验以及患者的配合程度,缺乏客观指标。因此,语音作为非侵入、易采集、低成本的客观指标,受到了
二十世纪末至今,多样化的通信业务对传输速率要求不断提高,为满足人们日益增长的通信需求,通信技术也不断地进行着变革与更新。某种程度上而言频谱资源是有限的,而传输速率的不断提高使得本就有限的频谱资源显得更加稀缺,多天线技术凭借其可观的分集增益可以有效解决频谱资源紧张的问题。多天线技术能够极大提升系统频谱利用率和信息传输速率,但随之而来的干扰管理问题却成为当今无线通信系统中制约系统性能的主要因素。干扰对
近些年来通信用户对于无线网络频谱资源的需求量日益增加,无线频谱需要被不断分配给各种不同的通信业务使用,导致可使用的频谱资源越来越稀缺。现有的固定频谱的分配方式已经无法满足快速发展的通信业务需求。为此,需要提出新技术以达到频谱资源高效利用的目的,如多天线技术,多址接入技术等。认知无线电技术的提出可以让认知用户通过频谱感知技术去查询系统环境中还没有被使用的频谱,从而实现主用户与认知用户的频谱共享。认知
[db:内容简介]
[db:内容简介]
[db:内容简介]