面向智能摇篮的语音交互系统研究

来源 :天津科技大学 | 被引量 : 0次 | 上传用户:liaotianeryi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的不断发展,AI技术的应用场景不断多元化。本文对婴儿的哭声分类算法和育儿领域的智能问答算法进行了研究,提出一种基于深度神经网络模型,对婴儿的哭声进行分类,对家长的提问进行回答。本文主要工作与创新如下:(1)通过研究邓斯坦婴儿哭声分类理论,并在视频网站收集婴幼儿哭声的视频和音频,对其进行人工剪辑和打标,得到具有5种情感类别的婴儿哭声音频数据。并以此为基础,进行声音向语谱图像的转化,得到具有5种情感类别的婴儿哭声语谱图像数据。通过爬取百度文库,豆丁等文档网站,得到育儿领域常用的育儿知识文档,并进行数据清洗和人工打标,得到育儿领域的问答数据库。(2)通过对婴儿哭声的语谱图数据分析,选用Inception-Res Net-v2模型进行训练,详细介绍了Inception-Res Net-v2模型的结构,并在此基础上进行更改。实验后的结果相比于改进之前的Inception-Res Net-v2模型,准确率有较大的提升,最后与传统的Res Net101网络进行了对比,验证了该模型相比于传统模型,只需要较少的训练轮次,就可以有更高的准确率。(3)对育儿领域的问答数据进行处理,主要涉及到利用搜索引擎工具(Elastic Search)对问答对数据建立索引。对多领域的问答数据提取关键词,对育婴领域的数据提取关键词词典。对问句利用Elastic Search进行召回,并对问句进行数据增强,其中数据准确主要涉及到EDA方法和同音字替换。数据增强处理之后得到的数据,再训练带有关键词信息的BERT模型,并与处理之前的数据进行对比。最后对实验结果进行总结,采用改进后的Inception-Res Net-v2网络后,对婴儿哭声分类算法的精度有明显提高。利用带有关键词信息的BERT模型,并进行数据增强的操作,能够提高问答系统的准确率,对智能摇篮车的应用具有重要意义。
其他文献
表面缺陷,作为工业制造领域最常见的产品问题之一,它的产生不仅影响产品的外观,更会降低产品的可靠性,减少其使用寿命。因此,高效的缺陷检测方案对提高产品质量具有重要的现实意义。基于深度学习的工业缺陷检测以其非接触性无损检测、低成本和高度智能化等特点,成为工业和学术领域的研究热点之一。基于数据驱动的深度学习依赖于大量有效样本集。受制于工业生产的影响,缺陷数据集常存在训练样本不足、类别不均衡等问题。加之深
学位
多旋翼无人机概念自从提出以来,凭借其结构简单、控制灵活、机动性强、可定点悬停与垂直起降的特点,可广泛应用在民用、工业、军工场景中,从而引起各个领域人才的密切关注。但是多旋翼无人机的前期发展依然受限于电子器件自重偏大、成本高,导航以及控制算法在无人机平台应用不成熟等关键技术的挑战,直至微机电系统(Mico-Eletro-Mechanical System,MEMS)传感器工艺水平提高以及产品质量控制
学位
随着民众消费、生活层次的不断提升和第三方支付系统的进一步开发,中国的电商环境逐步走向完善,线上购物开始深入到民众生活当中。而淘宝、拼多多、京东等电子商务的网络平台,也渗透到了人们日常生活的方方面面。对于传统电商系统采用的单体式架构,在项目初期阶段,用户较少,对系统的业务要求不是很复杂,为了方便开发和测试,可以将所有的代码都写到一个应用中。但随着用户量的增长和业务逻辑的不断复杂,代码量愈发增多,单体
学位
惯性技术具有稳定性好、抗干扰能力强等优点,因此被广泛的应用于各行各业,其中主要有航空、车辆以及现代通信设备等。由于惯性技术的不可替代性,相关科研人员需要不断提高惯性技术的精度。目前,提高惯性技术的精度,主要通过两个方面:一种是提高以现代工业技术为主的制造精度,另一种是通过线性回归、牛顿迭代等算法来补偿惯性元件的标定精度。但是在现阶段,工业制造技术遇到发展瓶颈,即材料、车床精度以及装配工艺已达到现阶
学位
激光告警设备是光电对抗技术的一项重要应用,也是光电对抗系统中必不可少的一个组成部分。传统的手动跟踪瞄准和传统的雷达、红外光下的目标检测跟踪已不能满足多元化且瞬息万变的战场的武器需求,在可见光下检测空中目标,获取目标的相关信息,进而跟踪瞄准目标实现有效打击目标成为了现代武器的一个重要的发展方向。本课题研制的激光告警激励系统是激光告警装备的一个重要辅助设计/测试系统,该系统可应用于激光告警设备开发的全
学位
学位
数字孪生技术起源于航空业,在智造业、医疗业和智慧城市建设领域有较好的表现。该技术的实施应用核心是建立包含物理实体性能、维护和运行状况数据的数字孪生模型。在公园领域,高品质的数字孪生模型能够成为公园实体和数据信息之间的桥梁,对公园的智慧管理有显著意义。由于公园环境要素多样、管理要求复杂,其三维建模、数据存储、渲染性能面对较大挑战。因此,信息数据、三维模型和公园实体之间一直存在无法高效、精准匹配的系统
期刊
城市水环境管理能力对构建人水和谐的美丽城市有直接影响。针对目前水环境管理系统中存在的数据共享能力不足、预测预警机制不完善、管理过程不完善等问题,设计基于数字孪生技术的城市水环境管理系统框架,围绕城市水环境管理常见业务范围,开发城市水环境管理业务应用,实现城市水环境监测、诊断、分析、预测和决策全过程闭合管理,以期为城市水环境管理提供更加科学化、精细化的有力支撑。
期刊
以铌酸锂薄膜为平台的薄膜声光调制器具有功耗低、稳定性好、高消光比、体积小、调制效率高、易于集成等优点。本课题针对铌酸锂薄膜光波导声光调制器展开了一系列的实验研究和理论分析,研究结果有较高的实用价值,对声光调制器的发展具有很好的指导意义。由于MZ结构的光波导具有较低的附加损耗、较高的耦合效率,所以本论文选用MZ光波导作为主要研究对象,主要工作内容包括:1、设计一种叉指电极与行波电极相结合的电极结构和
学位
本文利用计算机仿真技术,对实际生产线进行建模与仿真,通过设计DOE实验找出生产瓶颈并提出改善方案;结合遗传算法对混流订单投产序列进行优化;分别运用层次分析法和物元信息熵的概念对生产车间的整体健康度进行计算和预测。利用Plant simulation软件搭建硅片生产线的仿真模型,对生产线平衡以及瓶颈工位进行分析,通过DOE实验分析了设备故障率和暂存区容量对产量的影响效果,提出了相应的改善方案;按照改
学位