面向智能机器宠物的语音情绪识别研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:lijie041132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,使人与机器用自然语言进行对话的梦想一步步接近实现,人们对交互能力的要求也越来越高。简单的语音内容的识别已经不能满足人们的要求,让机器识别和理解语音中的情绪已经被看作最重要的问题之一。 本文首先详细介绍了语音情绪识别的现状以及机器宠物、语音、情绪等方面的概念;概括介绍了语音识别的基本知识;并简单介绍了colea软件、录音软件cool edit和Matlab软件及工具箱等。 本课题主要从实用角度,面向个人机器宠物,通过录制四个人常用话语建立语音库,并提取语音情绪特征。本文详尽的论述了五个特征 (即能量均值、能量曲线局部极点个数、发音的持续时间、基音频率均值和平均过零率)的提取方法,并对比其他文献,论证其在本课题实现上的优越性。情绪分类过程中,介绍了常见方法的基本原理,包括主元分析法、混合高斯模型法、矢量量化和支持向量机方法。重点说明模板匹配法的使用和优势。 课题的实现是在仿真智能机器宠物的识别并学习过程,软件的编制主要采用Matlab实现语音情绪分类并构建情绪模板进行识别,取得85%以上的识别率。而后对识别的结果通过人工神经网络进行学习、训练形成一定的知识库以进行进一步的识别,可达到90%的识别率,个别情绪识别率已经超过95%。 本文在识别过程中,大略的讨论课题相关的聚类分析和模糊理论以及对课题以后的发展有很好的启发性。识别后学习算法,提到了常见的学习算法,以及隐马尔可夫模型,人工神经网络。 本文在最后讨论了语音情绪识别的发展,以及与其他领域的融合,包括表情识别以及姿态识别等。
其他文献
在自适应模糊控制研究中,许多方案都属于直接型或间接型自适应模糊控制,这样的方案只是单纯利用控制行为知识或被控对象知识,这将导致人类经验知识或专家知识不能被充分的利用;而
无线传感器网络集成了传感器,嵌入式计算,网络和无线通信四大技术,它是一种全新的信息获取和处理技术,具有非常广阔的应用前景。 在大多数的应用场合,无线传感器网络会被布置在
尽管新能源不断出现,但受各方面条件的限制,中国未来很长一段时期仍将以燃煤发电为主。我国大力建设火力发电机组,以解决电力短缺的状况,而火电机组容量的增大对于机组安全经济运
随着高速动车组持续的高速运行,造成动车组运行的动态环境持续恶化,空气阻力作用、列车车厢之间的非线性和耦合特性等明显增强。针对高速动车组运行过程中的复杂性、不确定性
航标是航道的基础助航设施,直接影响船舶的航行安全。但航标的传统管理模式落后,己经无法适应日益繁忙的航道运输所提出的高质量安全航行的需求。本论文结合内河航道航标管理的
由于多智能体网络的广泛应用,近年来,多智能体网络化系统的协调控制得到了来自于自动化、数学、经济学等许多领域的学者的深入研究。本文综合利用矩阵论、图论及稳定性理论的相
随着全球经济一体化和市场全球化的日趋形成,企业间的竞争已发展成为企业供应链间的竞争。如何围绕核心企业构建合理、高效的供应链网络成为提高客户满意度和增强企业竞争力的
计算机视觉的主要任务之一就是对三维景物距离的感知,双目立体视觉技术是通过使用摄像机模拟人类的双眼来获取景物的深度信息,具有速度快,非接触式测量,简单可靠的优点,在民
动态光散射技术是测量亚微米及纳米颗粒的有效方法,它是通过散射光强信号随时间的起伏来获取颗粒粒径的技术。在动态光散射数据处理过程中,病态方程的存在使得噪声对反演的粒
随着信息技术的飞速发展和多媒体数据在宽带计算机网络中的大量传输,如何防止信息的盗版以及非法修改成为迫切需要解决的问题。在这一点上,传统的加密、解密手段无能为力。数字