【摘 要】
:
智能机器人的听觉系统很难像人的听觉系统那样可以轻而易举地从复杂环境产生的混合语音信号中感知某个人的语音并判断语音源个数。为了辅助智能机器人语音系统更好地分离混合
论文部分内容阅读
智能机器人的听觉系统很难像人的听觉系统那样可以轻而易举地从复杂环境产生的混合语音信号中感知某个人的语音并判断语音源个数。为了辅助智能机器人语音系统更好地分离混合语音信号,本文将引入视觉信号,即口型图像,来确定语音源个数。由此提出了基于稀疏表示的口型识别算法,通过检测说话人口型的开闭状态来判断该说话人是否构成语音源。本文在稀疏表示分类算法的基础上,分别从有识别力字典训练和样本优化两个方面进行研究。一方面,采用LC-KSVD算法通过带类标的训练集同步训练具有识别力的过完备冗余字典和最优分类器。在LC-KSVD算法中惩罚项不但包含了象征字典表征力的重构误差项,而且还加入了稀疏编码误差项和分类误差项以提高字典识别力,克服了K-SVD算法只注重字典表征力而忽略了识别力的不足,字典和分离器分开训练等缺点。另一方面,由于口型样本中存在口型区域以外的冗余信息且嘴巴姿态各异等因素影响了分类器对口型的识别,所以定义了一个由16个嘴唇轮廓特征点描述的标准口型模型,采用图像卷绕算法将口型样本映射到该标准模型中,以优化口型样本。将优化后的训练集样本直接堆叠或者经过LC-KSVD或K-SVD算法训练等方式获得过完备字典。在这两个方面的研究中,为了克服因字典过完备性而导致诸如OMP等贪婪算法可能无法收敛的缺点,本文在稀疏编码阶段均采用同伦算法求解稀疏系数。在此基础上,分别提出了基于LC-KSVD和同伦算法(Homotopy)的SRC人类口型识别算法以及基于图像卷绕(Image warping)和同伦算法的SRC人类口型识别算法。通过实验仿真,对比SVM,k-NN,MD等传统识别算法以验证本文算法的有效性。
其他文献
颅内动脉瘤显微外科夹闭术是处理动脉瘤的常用手段.但某些宽颈、巨大和形态特殊的动脉瘤以及动脉瘤颈部破裂或较脆者, 包裹治疗可作为一种辅助方法,为颈部残留夹闭不完全的动
本文首先总结了人脸技术的研究动机和应用,介绍了人脸识别技术的概念和主要研究方向,然后对人脸识别技术做了比较详细的全面综述,重点介绍了几种典型的人脸识别方法:特征脸方法、
目的 分析急性阑尾炎超声影像特征,提高超声诊断符合率.方法 选42例经超声诊断及外科手术病理诊断证实的急性阑尾炎患者,并对其超声影像特征进行分析.结果 42例患者中均能
干燥综合征临床上并不少见,但由于医生对本病缺乏警惕性,未能及时诊治,则可以导致病情恶化,出现肾小管酸中毒[1],严重酸碱及电解质紊乱,血液三系减少,甚至危及生命[2]。现将
目的 探讨应用椎弓根螺钉固定结合后外侧植骨治疗胸腰椎爆裂性骨折的临床疗效.方法 2006-06-2009-06采用椎弓根钉固定结合后外侧植骨治疗胸腰椎爆裂性骨折患者37例,观察手术
目的 分析妊娠滋养细胞肿瘤(GTN)的临床特点及诊治经验,探讨其临床治疗.方法 收集安康市中心医院GTN 34例的临床资料,分析其发病特点,经化疗或化疗联合手术、放射介入治疗后
选取2008-2009年我中心康复科收治的21例小头畸形患儿,进行临床资料回顾分析及随访研究。1临床资料1.1诊断标准头围测量,数值低于同年龄同性别组平均值2个标准差以上。评价参
随着无线通信技术的飞速发展,人们越来越追求超高传输速率的移动通信网络。MIMO技术运用时间分集和空间分集提高了系统容量,改善了无线通信链路的可靠性。但是由于天线设置的局
现对上前牙拥挤矫治过度1例分析如下。1病历摘要女,15岁。因上下前牙拥挤、不齐要求矫治,查:正面像:左右对称,侧面像:稍凸型。恒牙列,左右第一磨牙为安氏Ⅰ类,上前牙拥挤7 mm
目的 探讨三维超声产前诊断胎儿裂手经验、声像图特征和临床应用价值.方法 应用三维彩色多普勒超声对4例产前诊断为胎儿裂手畸形的胎儿进行图像分析并与产后结果 对照研究.