基于手势叫的机顶盒遥控技术浅析

来源 :中国数字电视 | 被引量 : 0次 | 上传用户:wsw361
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】:作为新一代实用人机交互方式,手势识别正受到人们越来越多的关注。本文首先介绍了当前手势识别技术的具体流程与发展情况。并基于目前手势识别对硬件需求的现状,探讨了将基于表观的实时手势识别技术应用于机顶盒等低速硬件设备的前景。
  【关键词】:手势识别 机顶盒 人机交互
  近年来,随着“智慧家庭”和“三网融合”等概念的兴起,家庭多媒体设备功能日趋完善,其控制与使用也变得越来越复杂,如何使家庭多媒体设备与正在兴起的家庭物联网设备控制与操作实现简单化、统一化、易用化成为相关行业亟待解决的问题。
  在日常生活中,对多媒体设备的控制主要依赖于遥控器,虽然人们一直在不断改进和强化遥控器功能,但这并不能从根本上解决遥控器操作复杂的问题。从古至今,语言和图像交流是人们主要的沟通与交流方式,手势则是一种日常、自然的信息交流方式,人们可以通过简单自然的手势表达复杂的信息。而手势识别研究的主要目的就在于使硬件系统能够识别人的手势信息,以使用户能够直接利用手势去驱动系统的具体应用,从而改善用户的操作体验。
  随着有线数字化的推进,机顶盒在客厅设备中所扮演的重要角色使得用户对机顶盒的人机交互友好度提出了更高的要求。基于此,如何通过手势识别成为相关企业改进机顶盒的控制方式一种很好的思路,本文的目的就在于探索通过手势识别,实现机顶盒控制的可能性。
  基于视觉的动态手势识别技术
  随着摄像头成像精度的提高及算法的不断改进,动态手势识别的识别率正在逐渐提高,其识别方式逐渐从数据手套识别、色彩手套识别向裸手识别方向快速发展。
  目前手势识别一般是利用单个摄像头,通过对手进行二维建模的方式实现识别,也可利用多个摄像头对手进行三维建模,从而实现手势识别。由于后者运算量大,对硬件设备的要求高,考虑到机顶盒的硬件条件,本文主要集中介绍通过二维建模实现动态手势识别型技术。
  目前基于表观的手势识别基本流程分为:手势图像信号的输入,手势分割、手势分析及手势识别,最后系统根据判断出的手势驱动具体的应用。
  1.手势分割
  手势分割就是将在摄像头中采集到的视频送入系统后,系统将视频流分为一帧帧进行分析,并从图像中分割出手所在的图形区域,以供下一步系统建模的过程。目前在技术上存在多种手势分割方式,主要包括根据肤色、运动情况、模板匹配、背景差分及综合模式等。
  根据测试结果,以上几种分割方式均有自己的缺点与环境适应性,一般而言,肤色分割与其他分割方式相搭配可在分割精度与计算量之间取得一个较好的平衡点。
  2.手势分析
  当成功将手从背景中分离出来之后,就要对手建立模型并实现识别。这一步的主要意义在于提取当前帧手势的特征,从而使系统根据分离结果的特征确定当前手势中的信息代码。在确保有足够冗余的前提下,确定手势的特征越少,计算机负担就越轻。在实际情况中,由于在不同的环境中,同一个特征提取方案的效果并不相同,很难挑选出最佳的提取特征,因此确定需要从图像中提取的哪些特征是最为重要的。
  目前常见的几种特征提取指标主要包括:灰度图像、手型区域、手型边界与指尖,针对不同的特征,对应有不同的描述。
  3.手势识别
  当所需的手势特征被分离出来后,系统就要将时间上连续的一系列手势特征归类,这就是手势识别。在动态手势识别中,建立的模型同时与时间及空间相关。归类完毕后,就可以看见一系列手的轨迹在时间与空间中的运动轨迹。与此同时,要提高手势识别的成功率还可以考虑使用动态手势信号与双手手势信号。
  手势识别与机顶盒遥控
  目前国内手势识别的实现一般是基于PC机,且一般是实验室产品,更加小型的设备一般无法提供高精度的手势识别所需要的硬件资源。从全球来看,目前,国外手势识别的小型化与实用化走在了国内同行的前列,国外在片上实现手势识别的技术主要分为三种模式:基于CPU、FPGA及专用手势芯片。
  在基于CPU的识别系统方面,BW Miners的论文显示其基于HMM模型系统在20138μs内就能完成一次完整的动态手势识别流程;在基于FPGA识别技术方面,早在2004年,V Bonato等就使用EPIS10F780C6实现了对7种手势的识别,且识别率高于99%,其共使用了2954个逻辑单元,占用235Kb的存储空间。
  在专用手势识别芯片方面,目前二维手势识别技术较为成熟的厂商为GestureTek公司,2011年七月下旬,高通宣布收购GestureTek手势识别技术,并将其引入现有以及未来的Snapdragon芯片中,但Snapdragon芯片作为一款手机处理器,并不适用于机顶盒。
  其他开发手势识别芯片的公司还包括Canesta公司及IDENT公司,但这两家公司的芯片主要用于三维手势识别。幸运的是,今年11月月初,德州仪器宣布,将在其明年发布的OMAP 5处理器中加入手势识别功能。
  从目前情况看,由于三网融合对音视频通信的需要,机顶盒内置摄像头将成为一个标准配置,手势识别需要的图像采集设备已经不是问题,其他硬件诸如RAM等也已完全符合手势识别的技术要求,出于成本考虑,目前国内有线运营商商大规模应用的机顶盒CPU频率基本在1GHz以下,因此,目前要实现高质量手势识别的主要瓶颈在于CPU。
  而要在机顶盒上低成本实现手势识别,最终还是要依靠CPU方式。随着高清及双向互动业务的快速发展,频率超过1GHz CPU的机顶盒已开始出现,其为直接使用CPU实现实时计算的手势识别提供了可能性,如果在外围配合一定的数字信号处理芯片,通过在图像预处理等阶段协助CPU进行视频信号处理,以减轻CPU负担的方式,则现阶段通过CPU方式实现手势识别是完全可行的。
  更重要的是,强终端型机顶盒在单纯收看视频时大量的CPU运算资源基本处于闲置状态,这种状况非常有利于运营商基于机顶盒开发手势识别等应用功能。
  结语
  目前手势识别应用的最大阻碍为识别的可靠性及成功率,其中对识别率影响较大的环节为手势分割与手势分析技术,由于系统在进行手势分割时需要面对复杂多变的外界环境,而外界环境中颜色与光照的变化及其他物体的干扰,都会降低系统进行手势分割的准确率,导致系统计算负担加重,从而影响系统的识别率,随着技术的进步与成熟及算法的进一步优化,笔者相信这些都将得到逐步的解决。
  综上所述,对有线运营商来说,机顶盒作为客厅设备的重要一员,在可以预见的未来,用户对其易用性的要求会越来越高,而可大幅提升用户体验的手势操控等新一代人机交互技术将会逐渐成为满足用户易用性需求的重要手段。
  同时作为物联网应用技术之一,机顶盒手势识别也可以与其他相关设备有机地整合成一个整体,通过机顶盒实现对家庭其他相关多媒体和其他电子、电气设备的控制功能;可以通过多媒体影音中心或其他设备实现对机顶盒在内的多媒体设备的集中控制,此外,运营商还可以利用机顶盒内置的摄像与图像处理功能,进行监测、监控功能等方面各项物联网应用的综合开发。
  可以预计,基于手势识别技术的操控方式将会很快变为现实并被市场所广泛应用。
其他文献
新闻链接>>    歌华有线5.46亿财政补助到位  歌华有线近日公告称,收到北京市财政局补助资金3,46亿元,用于北京市2011年推广130万户高清交互机顶盒补贴,专款专用。之前的2011年3月,公司收到了第一批补助款2亿元。根据公告,该款项入账后,按高清交互机顶盒预计使用寿命5年进行摊销,预计增加2011年利润总额2306.67万元。    新闻链接>>    机构预测广电网络2011年度业绩
期刊
横空出世的“云南模式”    “云南模式将是CNTV推广IPTV业务的主要模式。”9月18日,CNTV(中国网络电视台)总经理汪文斌在云南腾冲召开的首届IPTV业务研讨峰会上充满信心地表示,也难怪,在云南CNTV的IFvFV业务终于打开了局面。大概在两年前,CNTV和云南电视台合资组建了云南爱上网络有限责任公司,双方决定共同开展IPTV业务,也创造了央视、地方广电和地方电信三方共建IPTV合作运营
期刊
时間序列预测技术之规律谜团  这些天泰国的洪水情况令人堪忧,凶猛的洪水甚至威胁到了首都曼谷的中心城区。这让人想到了一个传说,有一个古老的家族总是能够躲过洪水的侵袭,使全族人的生命得以保全。原来,他们的祖先发现了一个神秘的规律:只要潮水退却的速度异常快,那么离大洪水爆发的时間就不远了。这时候族中的长辈就会带着全族人及时搬到地势较高的地带,躲过肆虐的洪水。  伴随着新技术带来的新媒体革命,三网融合就如
期刊
目前,中移动集团公司已将全业务发展的目标任务逐级下达了到各级移动公司,为此,市级公司按照集团公司的要求成立了全业务发展部门,针对全业务在人力、财力上进行了相應配置。但从目前的情况看,全国很多市级移动公司对全业务的支撑上存在着一些短板,如相对于传统业务而言,集团信息化产品、固定电话和固定宽带接入均是移动全业务的弱项,而在这些业务中,固定宽带接入业务重要性高,且为全业务最典型业务,为此,本文以此作为一
期刊
中电信:依托云技术,加固IDC堡垒  中国电信集团公司副总工程师靳东滨透露,中国电信将在明年正式推出云主机、云存储等系列产品。在具体推进过程中,电信将着重做好以下三个方面的工作:一是合作共赢,充分发挥技术示范效应;第二,是持续创新,以标准促发展,实现研发突破。十二五期间,中国电信将重点聚焦云平台、网络云承载、移动云应用、行业云应用等产品课题,加快研究制定和发布中国电信M2M技术规范和管理规范。在此
期刊
在上期《高清时代的电视环绕声》中,我们对适合环绕声的节目类型,以及前期制作和传输中的新要求、新内容等进行了探讨。本期我们将对后期制作,以及在环绕声制作中需要注意的问题进行介绍。    后期制作中的主观因素    相对于前期制作来说,后期制作有更充裕的时间来对节目进行仔细推敲和设计,所以主观上认真细致的工作态度更是制作高质量节目的前提。且在客观条件上,后期制作拥有更加丰富的处理手段和处理设备,像降噪
期刊
[摘要]本文详细介绍了双向网改中的主要技术,并已实际案例剖析了采用最适合本地网络状况的接入技术,网络搭建及相关应用情况。  [关键词]双向网、EPoN、EoC    概述    随着接入网技术的不断发展和成熟,目前在有线电视网络双向网改造的方案中,除了传统的CMTS+CM入户方案外,各种标准、非标准的技术异彩纷呈。总结起来,主要有以下几种:  1.EPON+基带EOC技术:采用基带传输,一般使用0
期刊
中共中央政治局委员、国务院副总理张德江11月10日在出席第八届国家信息化专家论坛时强调,要深入贯彻落实科学发展观,以推进信息化工业化深度融合为中心,以突破核心关键技术为重点,以构建新一代信息基础设施为依托,以确保网络和信息安全为保障,全面提高国民经济和社会信息化水平。   张德江指出,党中央、国务院高度重视信息产业和信息化发展,作出了大力发展信息产业、大力推进国民经济和社会信息化的战略决策,出台了
期刊
前几期的文章,我们主要从经营分析系统、精准化营销几个方面探讨了数据挖掘技术在广播电视运营领域应用的前景,本次我们将结合具体的案例,来演示数据挖掘技术在有线电视销售方面的具体应用。    啤酒与尿布——什么是交叉销售    在数据挖掘领域,最经典的案例就是零售服务当中的啤酒与尿布的故事。一家连锁超市通过数据挖掘发现,婴儿尿布和啤酒这两个从表面上看毫不相干的商品类别之间竟然有着惊人的联系:“在所有购买
期刊
2011年11月9日,中国电子商会、国美电器于北京联合发布《2011-2012中国彩电消费市场发展白皮书》。针对2011年中国彩电行业的整体发展、产品趋势、消费者需求特征进行了总结,并对2012彩电市场走势以及消费需求趋势进行展望:智能电视强势渗透、3D普及、主流消费大尺寸将成为今明两年中国彩电消费的主要特征。逆市增长  在即将过去的2011年,整个宏观经济形势并不乐观,通货膨胀成为整个国民经济的
期刊