论文部分内容阅读
随着信息技术的快速发展,大量高维数据产生并积累,严重影响知识的发现和理解,因此对高维数据进行降维至关重要。特征选择是使用最为广泛且有效的降维方法之一,但现有的特征选择算法存在分类性能和运行效率不匹配的问题。为了在它们之间找到一个合理的平衡,本文在FCBF算法的基础上提出了AWFCBF和SHFS两个特征选择算法,提高了学习算法的分类性能和稳定性。特征选择算法在诸多领域都得到了广泛应用,本文主要将其用于基于语音的心理压力评估研究中。相较于传统的基于量表的方式,通过语音评估心理压力具有无侵入、方便快捷、易被人们接受的特点。但如何选择有效的声学特征子集是研究难点之一,而这恰恰是特征选择要解决的问题。本文设计了由工作负荷诱发心理压力的语音实验,采用SHFS算法选择声学特征,并对选择的结果进行了分析。实验结果表明,SHFS算法可以选择有效且稳定的声学特征。本文的主要贡献与创新如下:1.在FCBF特征选择算法的基础上提出了AWFCBF算法,即依据C-相关取值的大小赋予相应比例的权重,以期加强C-相关取值较大的特征之间的依赖性,减少C-相关取值较小的特征之间的冗余性。实验结果表明AWFCBF算法提高了学习算法的分类性能和稳定性。2.通过对AWFCBF特征选择算法的优化提出了SHFS算法,即对C-相关取值较大的特征采用顺序后向搜索的方法,然后对C-相关取值较小的特征采用顺序前向搜索的方法选择特征子集。实验结果表明,SHFS特征选择算法能够在充分降低运行时间的同时,提高学习算法的分类性能和稳定性。3.在基于语音的心理压力评估研究中,应用SHFS算法选出了有效且稳定的声学特征集。通过对该特征集分析可知,spectral特征更适合vowel,prosodic和cepstral特征的组合更适合figure,这三类特征的组合在sentence中表现更好;短期心理压力会受到长期心理压力的影响,所以在探究心理压力的评估时,应该同时考虑这两类心理压力。