声纹 让“芝麻开门”成现实

来源 :电脑爱好者 | 被引量 : 0次 | 上传用户:baino1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  手机能够智能辨识主人的声音进行解锁,一根手指头都不用动就能打开手机。如此炫酷的语音智能控制功能,让智能手机显得更通“人性”,那么手机是如何做到这些的呢?
  声纹解锁技术原理
  实际上,声纹解锁的原理就是建立声纹和声纹识别。第一是声纹注册,也就是通过用户的互动,建立一个语音的身份证;第二就是声纹识别,通过既有的声纹模型与当前的用户语音对比,看看是不是手机真正的主人。
  在声纹注册阶段,用户需要对着手机念一段文字或者数字,手机会要求用户重复输入同样的语音三次,这有点类似于我们设定密码中的两次输入。而这三次语音输入,对于手机里的语音识别系统来说就是学习和建立模型库的过程,从而实现语音特征的提取。
  在声纹识别阶段,用户只需要输入注册时使用的语音,通过手机系统的验证,就能实现语音解锁登录了。
  通过上面的讲解可以看出,声纹识别的关键技术在于语音预处理后的特征参数提取技术,那么语音特征参数是如何提取的呢?
  目前常用的语音特征参数的提取技术主要有以下几种:
  一是语音频谱参数。这种参数的提取主要是基于说话人发声器官,如声门、声道和鼻腔等的特殊结构而提取出说话人语音的短时谱特征(即基音频率谱及其轮廓)。它是表征说话人声音的激励源和声道的固有特征,可以反映说话人语音器官的差异,而短时谱随时间或幅度变化的特征,在一定程度上反映了说话人的发音习惯。
  二是小波特征参数。这种参数的提取是利用小波变换技术对语音信号进行分析处理以获得表示语音特征的小波系数。小波变换具有分辨率可变、无平稳性要求和时频域兼容表征等优点,能够有效地表征说话人的个性信息。因此,它在声纹识别系统中实际应用时体现出计算量小、复杂度低、识别效果好等特点,是近年来语音特征参数提取技术的热点。
  简单来说,因为人的发声器官,包括声带、软颚、舌头、牙齿、唇等,存在着大小、形态及功能上的差异。这些差异会导致发声气流的改变,造成音质、音色的差别。此外,人发声的习惯亦有快有慢,用力有大有小,也造成音强、音长的差别。这些特征表现了不同声音的不同波长、频率、强度、节奏。而提取过程就是把声波的变化转换成电讯号的强度、波长、频率、节奏变化,保存下来并建成语音模型库。
  声纹解锁的绝招
  你一定会有这样的疑问,如果声纹提取时是在安静的环境中进行,要在充满噪声的环境中使用声纹解锁,识别系统还能正常工作吗?这里就不得不提到声纹解锁的绝招:噪音处置算法。
  大家知道,即便在嘈杂的环境中,我们人类还是有一种超能力—可以将噪音当做耳边风,将注意力集中在对方说话的声音上。但是手机相对伟大的人类来说,这种能力绝不是与生俱来的。
  所以声纹解锁功能有两个超级的语音处理能力。第一个是使用语音端点检测算法,探测用户输入语音的起始和终止位置,也就是说,哪怕外面吵翻天,但用户可能一个字都没有说。这种算法可以精确探测到用户说话到底说了哪一段,因此分析起语音来可以有的放矢。第二个是使用信噪比估计算法,检测用户输入语音的质量是否满足需求。如果背景噪声太强,就会提示用户重新输入。
  其实,声纹识别的使用在军事或刑侦上经常用到,就拿我们熟悉的美国对伊拉克的战争来说,在美国第一轮“斩首”行动之后,伊拉克总统萨达姆马上发表电视讲话,鼓舞士气,同时证明自己的存在。此时,德国科学家分别从图像理解与分析、声纹识别两个方面证明发表讲话的就是萨达姆本人。这样一则不惹人注意的新闻消息背后,却有着一个不同寻常然而又为各国情报部门所大力研发的军事科技:声纹识别。无论萨达姆在何时何地发表不同内容的讲话,他的声纹始终是不变的,因此可以由此断定一种声音是否是其本人发出的。
  目前,声纹识别在生活中的应用才刚刚开始,也许在不久的将来,声纹识别技术会有新的玩法。可以预见,“芝麻开门”的故事将越来越多。
其他文献
许多PPT作品在微博或网站发布时,采取把每个幻灯片页面转换为图片并拼接成长图片的方式。这种长图片下载到电脑中浏览展示时很不方便,而转换成PPT可以方便地进行展示。把长图片转换为PPT的方法包括两步:第一是把长图片切割成一张张图片,第二是把系列图片转换为PPT。  分割图片的方式很多,可以用Photoshop或美图秀秀等软件来做,但比较费时。用专门的图片分割软件来做,则高效快速。  图片分割软件有好
期刊
[摘要]目的 观察老年严重脓毒血症患者血浆BNP水平的改变并探讨其临床意义。方法 观察对象分为三组:78例老年严重脓毒血症患者,45例急性心力衰竭患者和59例健康对照组,测定其血浆BNP浓度。对其中的22例严重脓毒血症患者和16例心力衰竭患者分别进行肺动脉导管监测以评价血流动力学状态。结果 (1)老年严重脓毒血症组、老年心力衰竭组和健康对照组的血浆BNP水平依次为912±757pg/ml,1143
期刊
这才像是旗舰之作  说实话,华为近期推出的几款手机都没让我品出高端的“味道”,但将Ascend D2拿到手里后,终于让我找到了久违的“旗舰”感觉,绝对是华为历代产品中做工最为优秀的产品,不是之一!  Ascend D2采用了金属材质的边框,注塑工艺的后壳也极具质感。手机背部略带弧线,可以很好地与手掌贴合,而音量和电源开关都集中在机身右侧,在提升把握手感的同时还为单手操作提供了便利。这款产品安装SI
期刊
超导材料被发现以来,其优异特性所展现出来的应用前景一直十分诱人。而随着高温超导技术的迅猛发展,超导材料的实用价值显得愈发现实。高温超导材料的用途非常广阔,大致可分为3类:大电流应用(强电应用)、电子学应用(弱电应用)和抗磁性应用。大电流应用即超导发电、输电和储能;电子学应用包括超导计算机、超导天线、超导微波器件等;抗磁性主要应用于磁悬浮列车和热核聚变反应堆等。其中超导电子学应用是非常重要的一方面,
期刊
随着《“十三五”国家战略性新兴产业发展规划》的全面出台,石墨烯已成为“十三五”期间重点开发的新兴材料之一。凭借其优异的力学、光学、电学和热力学等性能,石墨烯纤维已成为目前的研究热点,它在功能纺织品上的应用日益广泛。人们健康消费需求的不断提升,使得“石墨烯+健康”的主题备受青睐,与人类健康息息相关的石墨烯功能性纺织品逐渐走进了百姓生活。  2017年6月3日,由中國纺织工业联合会指导,中国化学纤维工
期刊
望远镜是人类观察世界、认识宇宙的重要工具,是人眼的延伸。对一台望远镜而言,镜片是最核心的部件,而材料学的发展,则对望远镜镜片的设计和选材有着决定性的作用。在一般人的概念中,望远镜的镜片是无色透明的光学玻璃。实际上,古人用来贴花黄、正衣冠的铜镜,也曾在望远镜的发展史上扮演过重要的角色。  独辟蹊径:望远镜史上的“牛顿革命”  1609年,随着伽利略将自制的望远镜指向月球,这一仪器从此成为了天文学家观
期刊
Windows 8平板应该是近期市场的热门之一,但其在5000元价位上只有两个选择:ARM处理器+Windows RT系统,或是Atom处理器+Windows 8系统。前者因不兼容桌面程序而饱受争议,而后者则因具备PC特性而受到广泛关注。“5000元Windows 8平板”的称号看似超值,但如果仔细分析一下,不难发现其中的价格水分。  旧瓶装新酒的Atom  Atom本来是英特尔专为上网本打造的超
期刊
DNS是域名系统(Domain Name System)的缩写,由解析服务器和IP服务器组成。简单点说,DNS就是一台(或多台)在网络上的服务器,专门为大家上网时解析网址的IP地址。比如CFan官网地址www.cfan.com.cn,对应的IP地址是219.234.93.150,将网址转换成真正的IP地址,中间担当“翻译”的就是DNS,因此在某种程度上DNS服务器直接决定着网页浏览速度。  如何启
期刊
[摘要]目的通过分析老年2型糖尿病(T2DM)患者α1-微球蛋白(α1-MG)的独立相关因素,寻找减少老年T2DM患者α1-MG排泄的途径。方法 对304例老年T2DM患者进行问卷调查、体格检查、动态血压检测、实验室检查和α1-MG检测,运用Logistic回归分析筛选影响老年T2DM患者α1-MG排泄的独立相关因素。结果老年T2DM患者α1-MG排泄的独立相关因素有24h收缩压(β=0.029,
期刊
[摘要]目的 研究自发性脑出血患者血清基质金属蛋白酶-9(MMP-9)及其抑制因子基质金属蛋白酶抑制因子-1(TIMP-1)的含量及临床意义。方法 采用酶联免疫吸附法对62例48小时内入院的脑出血患者血清MMP-9和TIMP-1水平进行测定,与正常对照组进行比较,同时用免疫比浊法测高敏C-反应蛋白(hs-CRP)水平,并与CT所示血肿周围水肿体积和神经功能评分进行相关分析。结果 脑出血患者血清MM
期刊