面向智能船舶的人脸和语音混合型识别系统

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:liostone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的快速发展,海上贸易事业日益繁荣,使得海上交通负载变重,航道更加拥挤,进而带来较大的交通安全隐患。特别是当海况不好或者航程较远时,复杂的驾驶环境给船员和乘客的生命财产安全带来巨大的威胁,对船舶驾驶员要求就更高,因此智能化船舶驾驶或无人船的应用将变的更有意义。随着人工智能和传感器等技术的飞速发展,指纹识别、脸部识别、语音识别、手势识别和行为识别等生物识别技术的应用也越来越多,利用指纹、声纹和面部识别进行身份认证越来越受到人们的关注。其中,人脸识别技术和声纹识别技术是具有高度个性化并采用非接触方式识别的便捷身份识别方式。本文提出的面向智能船舶的人脸和语音混合型识别系统,使船员在驾驶过程中可以利用人脸识别和声纹识别进行双重身份认证,并通过语音来发出指令,进而迅速准确的完成人机交互。在开放、动态的环境中,通常需要面部和声音的双重认证,以保证其准确性及安全性。船舱就是一个典型的开放、动态的环境,需要面部和声音的双重识别来进行发令人与命令执行权限的匹配。因此,面向未来的智能船舶需要这种新型智能的人机交互技术。为了迅速、智能地完成人机交互过程,识别发令人的身份和命令内容变得至关重要。针对上述问题,本文主要研究工作如下:(1)提出了一种基于数据驱动的声纹特征提取方法,该方法在倒谱的基础上利用层次聚类算法对语音数据进行自下而上的特征聚合,从输入的语音信号中提取出能够表示声纹特征的向量。并通过实验证明了基于数据驱动的层次聚类算法提取出的声纹特征比使用经典特征MFCC(Mel-frequencycepstral coefficients)有更好的识别效果。(2)人脸检测方面,将经典的人脸检测算法Haar、HOG(histogram of oriented gradients)和 MTCNN(multitasking convolution neural network)进行了 对比,得出在对人脸进行检测时,MTCNN的计算性能极大的优于经典的人脸检测算法,在检测速度上也可以满足实时的人脸检测需求。人脸特征提取方面,对比了 LBPH(localbinarypatterns histogram)与基于神经网络的人脸特征提取算法FaceNet,在数据测试集CASIA-FACEV5上FaceNet相对于LBPH算法在正确率上显示出了巨大的优势。(3)在声纹识别和人脸识别的基础上,进行身份识别。结合科大讯飞的语音识别技术完成语音内容的识别,对识别的内容进行分词处理,同时完成命令的精确匹配,并对命令执行权限进行了验证。
其他文献
随着全球一体化的经济发展态势以及技术层面日新月异的深化革新,国际贸易在全球经济中的地位日益凸显,尤其是服务贸易的发展备受关注。同时,互联网带来的第三次工业革命,为服务部门带来了革命性的改变,国际服务贸易中面临的距离、时间及成本问题得以找到新的解决途径,使得各服务部门得到迅速发展。另外,全球的贸易方与营商模式也在互联网技术的作用下,发生巨大转变,逐渐与跨境数据与电子网络产生联系,逐步走向深化改革。在
目的:研究丹参酮IIA联合DAPT对TGF-β1诱导的人肾小管上皮细胞(HK-2)转分化标志物E-cadherin、Snail、N-cadherin、FN的表达及Notch1/Jagged1信号通路传导的影响,证实丹参酮IIA联合DAPT抗肾间质纤维化的协同效应,为中西分子药物配伍抗肾间质纤维化提供理论依据。方法:(1)CCK-8法检测丹参酮IIA及其联合DAPT对细胞活性的影响,筛选最佳药物浓度
事物的联系是多种多样的,因果联系则是事物普遍联系中的一种,也是不可或缺的。在日语句子中,「から」和「ので」都是表示“原因”意义的接续助词,它们之间到底有什么区别呢?
随着素质教育的推行,学校教育逐渐转变了教学理念,开始重视起学生综合素质的培养。初中历史做为我国五千年文化的展示,对于学生认识水平的提高和爱国精神的培养室十分重要的。本
步态识别作为一种基于人体生理和行为的生物特征识别技术,由于其具有非侵犯性和远距离识别性,在计算机视觉等领域一直都是备受关注的研究热点,在无人驾驶、视频监控、公安刑
随着我国经济持续稳定的发展,居民生活水平得到快速改善,有效地带动了机动化水平和旅游业的兴起,这些因素又促进了交通运输业的快速发展。交通运输业的发展不仅消耗了大量的
聚氨酯弹性体由于其出色的性能在工业生产以及日常生活中得到广泛的应用,相较于塑料、橡胶材料,聚氨酯弹性体具有性能可调节范围广、出色的阻尼性能、高强度、耐磨等优异的特
以自身优势为依托,搭建起以生产基地为基础。以农产品交易市场为枢纽,以大型超市集团为终端的农产品经营服务体系,促进农产品的流通现代化。
广播、电视、网络体育赛事解说有趋同化的现象,但是又各有不同。广播体育赛事解说要求:明确解说语言节奏的艺术性;明确赛事语境情绪的合理性;明确赛事中"阅读比赛"的重要性。
随着计算机技术的迅猛发展,数值模拟方法成为船舶与海洋工程领域中解决水池试验的重要途径,进而衍生出数值波浪水池技术。无论对于数值水池还是物理水池,造波和吸波同为重要