基于语音交互及人脸识别的服务机器人研究与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:xaolan811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技变革的潮流涌现,人们对服务机器人的需求愈发强烈,其产业发展方兴未艾,语音交互和人脸识别是服务机器人的基本功能。在服务机器人的工作场景中,机器人自身的技术瓶颈和环境中的不确定因素会影响用户的交互体验。在语音交互中,部分服务机器人由于技术缺陷,识别结果存在较大误差;而即使识别正确,由于匹配策略欠缺,给出的答案相去甚远;在人脸识别中,部分服务机器人对光照变化和随机噪声非常敏感,识别结果极易受到干扰;同时某些人脸识别算法存在缺陷,在多人脸存在和人脸姿态变换的情况下准确率较低。针对服务机器人中语音交互和人脸识别存在的问题,本文结合当前模式识别等最新的研究成果,借助语音识别技术实现了用户提问语音的文本识别,依据TF-IDF算法提取问题中的核心关键词,并给出针对性合理答案;利用HOG特征和特征描述子,实现在复杂的工作场景中识别用户,抗干扰性较好且人脸识别准确率高;应用场景以图书馆服务机器人为例,设计并实现了一个服务机器人软件系统,为用户提供面向图书馆应用的智能化服务。本文的主要工作和成果如下:1.实现了服务机器人的语音交互功能。首先系统对用户提问进行降噪处理,调用语音识别SDK进行识别;接着通过TF-IDF算法提取问题中的关键词;最后与语料库中的问题进行相似度计算,进而获得匹配度最高的答案。2.实现了服务机器人的人脸识别功能。首先系统对视频帧进行光照补偿和图像降噪,选择HOG特征来检测人脸;接着利用ResNet提取特征描述子,并通过结合特征描述子的人脸跟踪算法锁定目标人脸;最后依据目标人脸的特征描述子,与人脸库比对相似度来识别身份。3.以图书馆服务机器人为例,实现了一个服务机器人软件系统。系统实现了服务机器人与用户的语音问答功能,并且在真实场景中能够准确地识别人脸并记录识别信息,降低了管理人员的工作量。同时管理人员可以在后台管理中自由地操作语料库和人脸库,使得库中内容能够得到及时更新和调整。本文提出的基于语音交互及人脸识别的服务机器人软件系统实现方案,满足现阶段服务机器人的现实需求。本软件系统在某高校图书馆投入试用,效果良好。
其他文献
直流系统作为为变电站电气设备的操作与控制电源,它的可靠与否直接影响着变电站电力系统的安全与稳定。因此,文章全面分析了变电站直流系统故障,以期提高其供电效果。
对电子政务的基本概念及其特征进行了阐述,分析了电子政务在山西省的发展现状,并提出了电子政务建设过程中存在的问题及相应的对策和建议。
在有害气体的高危环境下或者在抢险救灾的现场中,作业人员直接进入现场作业可能会造成不必要的人员伤害。本设计以基于STC12A60S2单片机为主控器,实现了高性能智能车和遥控器
目前对于现代化的研究,学术界基本上都认可现代化的研究与口岸密不可分。近代开埠通商以来,万县港的贸易发生了巨大变化,而港口贸易的背后,需要腹地的支撑,万县港贸易的发展
建设清廉浙江,是新时代“八八战略”再深化、改革开放再出发的题中之义。推动清廉浙江在绍兴的生动实践,需要不断提升廉政文化的渗透力和创造力,通过春风化雨、润物无声的廉洁文
报纸
脾脏是人体最大的免疫器官,具有造血及免疫功能。脾切除的手术指征包括:脾脏外伤、脾肿瘤、门脉高压症及遗传性球形红细胞增多症、特发性血小板减少性紫癜等血液系统疾病。199
本文阐述了工程质保金的含义、约定;分析目前工程建设中质保金管理存在的问题,并提出建设单位质保金管理的要点。
厄内斯·托纳萨雷是巴西伟大的作曲家,也是二十世纪拉丁美洲三位最重要的作曲家之一。他用自己独特的音乐语言向全世界展示出巴西音乐无穷的活力和激情。本文从他的生活背景
外汇风险是一个开放型经济所必须要面对的问题,各国央行都把保持币值稳定作为其重要任务,涉外企业因外汇风险处置不 当而蒙受巨大损失的事例屡见不鲜。无论是以观上还是从微观
蒽环类药物是乳腺癌术后辅助化疗的基石,但随着紫杉类药物和靶向药物如曲妥株单抗等新型抗肿瘤药物的出现,再加上蒽环类药物固有的心脏毒性,使得人们开始思考,蒽环类药物在早