论文部分内容阅读
【摘 要】汉字信息提取技术是写字机器人中的关键技术之一,机器人能够写出准确美观的文字的基础是必须要有正确的文字信息输入。本文阐述了三种文字识别技术:字库提取技术、机器视觉文字提取技术和模仿学习提取汉字信息技术,介绍了它们的关键技术点及实现方法,最后展望了书写机器人及汉字识别提取技术的发展方向。
【关键词】书写机器人;模仿学习;机器识别
汉字文化博大精深,经过6000多年的变化,汉字数量达8万之多,标准的书法字体有甲骨文、金文、小篆、隶书、楷书、行书等等,因此,汉字的书写不同于英文的书写,其书写更为复杂,更为讲究,笔划、笔顺、用笔力度、停顿等都是书写时要注意的问题,写字机器人要写出结构美观的汉字,首先要获取准确的汉字信息。机器人汉字信息提取主要有三种途径:已有字库、机器视觉和智能模仿学习。在信息提取的过程中,涉及多种技术和方法,本文对机器人汉字信息提取技术做了全面分析研究,并展望智能机器人中汉字提取技术的发展趋势。
1 字库汉字信息提取技术
书写机器人从现有字库中获取汉字信息,对其进行再现书写。字库一般选取文字矢量文件或矢量信息,如AutoCAD公司的.shx文件和早期的UCDOS汉字矢量库,现在使用较广泛的是Windows平台下的TrueTypeFont矢量字库,TTF字库是Microsoft公司和Apple公司共同推出的一种轮廓字体。TTF是一种矢量字体,它用一系列点构造字型轮廓,在此基础上用一系列指令调节,使轮廓线变的平滑,可以得到良好的显示效果。一个字符由一系列闭合轮廓线组成,每条闭合轮廓对应一个TTPOLYGONHEADER数据结构,而一条轮廓包含至少一条曲线(包括折线和二次样条),曲线由TTPOLYCURVE数据结构定义。利用Win32的API函数GetGlyphOutline()提取所需汉字的轮廓线数据或位图数据,通过编程把TTPOLYGONHEADER结构中POINTFX形式的点坐标转换为Cpoint坐标,分离出组成轮廓线的各条折线和Bezier曲线。将汉字轮廓线数据中点坐标保存在一个数组中,用于控制写字机器人的笔尖移动轨迹控制。
如果写字机器人要求书写的汉字尺寸很小,书写双线字效果不好,这时就需要绘制单线字。单线字绘制一般选取点阵字库,文字提取主要采用轮廓提取和轮廓跟踪技术。用“0”和“1”分别表示无笔划和有笔划,将汉字点阵信息形成字符矩阵,从笔划的始点出发,在其8个相邻点中选定跟踪方向,在此方向上连续跟踪,直到没有后继点为止。
2 机器视觉提取文字信息技术
机器视觉提取文字信息技术可以使机器人灵活的写出任意字体的汉字。将任意字体的汉字放在摄像头下,摄像头将拍摄的图像传送到计算机,计算机处理图像得到文字的坐标文件。计算机接收到图像后,首先要对图像进行去除噪声、倾斜校正、阈值化运算、行列切分、闭运算、细化运算和去毛刺处理,将图像处理成黑白的二值图像,而且要轮廓光滑,突出汉字骨架。然后进行提取文字筆划工作,提取笔划的最大难点是镜头下的汉字的不可预测性及随意性,尤其手写连笔汉字。一条连续曲线对应一个笔划,把汉字进行连通域的划分处理,然后按照先左后右、先上后下的顺序在每个连通域内提取笔划保存笔划坐标,按照1中提到的轮廓跟踪方法确定笔顺。
3智能模仿汉字书写技术
我们让机器人书写一个汉字,我们稍微示范一下,机器人就能学会!一旦机器人具备这样的模仿学习能力,机器人就拥有了类似人类的模仿学习能力,智能机器人通过自主学习获得具有切实的类人的智能行为能力,这是机器人的终极理想状态。写字机器人模仿学习主要是通过人手牵引,与机械手臂相互协作使之获取相应汉字信息,最终实现书写。Toru Tsumugiw提出了一种基于延时定位的人机交互的可变阻抗的控制方法[4],由压力传感器实时获取操作者手臂前端的力度,使机器人末端传感器实时获取压力和位置数据,实时获取压力与位置数据,使人机协作系统更加稳定。Andre Lemme[5] 以人形机器人iCub为平台,构建了一个运动基元库,通过人类的引导能够自监督地从复杂轨迹中感知并学习运动基元,学会相应的轨迹动作,并能使用复杂的手写轨迹进行评价。
另一种模仿学习的方式就是通过观察和模仿人类,获取对应的汉字信息并进行汉字的书写。例如V. Mohan等人[6] 以婴儿人型机器人iCub 为平台,通过综合系统学习绘制从简单到复杂的形状图案,即通过观察示范者的动作,特别是示范者末端执行器的轨迹,来学习模仿示范者的动作。在此基础上,也有研究者通过观察人的手势来实现机器人手臂的书写。通过运动传感器输入设备实时捕捉示范者的手势轨迹,采用简化的分类集成器识别人体不同的动作手势,来控制机械臂书写不同的笔画,最终实现整个汉字的书写。
4 结束语
目前写字机器人汉字信息提取技术主要是字库提取和机器视觉提取,模仿学习技术还不是很成熟,写字机器人的应用面也比较窄。随着计算机技术、图像处理技术、传感器技术和人工智能技术的不断发展,写字机器人必将从只能重复单一工作发展为像人类一样能模仿学习,并能随着经验的积累自动提高性能,甚至可以自我创作书法。强调机器人的自主学习方式,研制能够使人类的生产生活发生深刻变革的具备“通用智能”的机器人,无疑是机器人未来的发展方向。
参考文献:
[1]何薇,钱增磊 等.基于机器视觉的机器人写字技术的设计[J].江南大学学报(自然科学版).2011,10(5):513-516
[2]曾华琳,黄雨轩,晁飞,周昌乐.书写机器人研究综述[J].智能系统学报,2016,11(1):16-26..
[3]王光建,梁锡昌.写字机器人的文字矢量化及应用[J].现代制造工程,2004(7):40-42.
[4]TSUMUGIWA T,YOKOGAWA R,KHARA R.Variable impedance control based on estimation of human arm stiff-ness for human-robot cooperative calligraphic task[C]//Proceedings of IEEE International Conference on Robotics and Automation.Washington,DC,USA,2002:644-650
[5]LEMME A,REINHART R F,STEIL.J.J.Self-super Vised bootstrapping of a movement primitive library from complex trajectories[C]//Proceedings of the 14th IEEE-RAS International Conference on Humanoid Robots(Humanoids).Madrid,2014:726-732.
[6]MOHAN V,MORASSO P,ZENZERI J,etal.Teaching a humanoid robot to draw’Shapes’[J].Autonomousrobots,2011,31(1):21-53.
(作者单位:1石家庄学院机电学院;2陆军工程大学无人机工程系)
【关键词】书写机器人;模仿学习;机器识别
汉字文化博大精深,经过6000多年的变化,汉字数量达8万之多,标准的书法字体有甲骨文、金文、小篆、隶书、楷书、行书等等,因此,汉字的书写不同于英文的书写,其书写更为复杂,更为讲究,笔划、笔顺、用笔力度、停顿等都是书写时要注意的问题,写字机器人要写出结构美观的汉字,首先要获取准确的汉字信息。机器人汉字信息提取主要有三种途径:已有字库、机器视觉和智能模仿学习。在信息提取的过程中,涉及多种技术和方法,本文对机器人汉字信息提取技术做了全面分析研究,并展望智能机器人中汉字提取技术的发展趋势。
1 字库汉字信息提取技术
书写机器人从现有字库中获取汉字信息,对其进行再现书写。字库一般选取文字矢量文件或矢量信息,如AutoCAD公司的.shx文件和早期的UCDOS汉字矢量库,现在使用较广泛的是Windows平台下的TrueTypeFont矢量字库,TTF字库是Microsoft公司和Apple公司共同推出的一种轮廓字体。TTF是一种矢量字体,它用一系列点构造字型轮廓,在此基础上用一系列指令调节,使轮廓线变的平滑,可以得到良好的显示效果。一个字符由一系列闭合轮廓线组成,每条闭合轮廓对应一个TTPOLYGONHEADER数据结构,而一条轮廓包含至少一条曲线(包括折线和二次样条),曲线由TTPOLYCURVE数据结构定义。利用Win32的API函数GetGlyphOutline()提取所需汉字的轮廓线数据或位图数据,通过编程把TTPOLYGONHEADER结构中POINTFX形式的点坐标转换为Cpoint坐标,分离出组成轮廓线的各条折线和Bezier曲线。将汉字轮廓线数据中点坐标保存在一个数组中,用于控制写字机器人的笔尖移动轨迹控制。
如果写字机器人要求书写的汉字尺寸很小,书写双线字效果不好,这时就需要绘制单线字。单线字绘制一般选取点阵字库,文字提取主要采用轮廓提取和轮廓跟踪技术。用“0”和“1”分别表示无笔划和有笔划,将汉字点阵信息形成字符矩阵,从笔划的始点出发,在其8个相邻点中选定跟踪方向,在此方向上连续跟踪,直到没有后继点为止。
2 机器视觉提取文字信息技术
机器视觉提取文字信息技术可以使机器人灵活的写出任意字体的汉字。将任意字体的汉字放在摄像头下,摄像头将拍摄的图像传送到计算机,计算机处理图像得到文字的坐标文件。计算机接收到图像后,首先要对图像进行去除噪声、倾斜校正、阈值化运算、行列切分、闭运算、细化运算和去毛刺处理,将图像处理成黑白的二值图像,而且要轮廓光滑,突出汉字骨架。然后进行提取文字筆划工作,提取笔划的最大难点是镜头下的汉字的不可预测性及随意性,尤其手写连笔汉字。一条连续曲线对应一个笔划,把汉字进行连通域的划分处理,然后按照先左后右、先上后下的顺序在每个连通域内提取笔划保存笔划坐标,按照1中提到的轮廓跟踪方法确定笔顺。
3智能模仿汉字书写技术
我们让机器人书写一个汉字,我们稍微示范一下,机器人就能学会!一旦机器人具备这样的模仿学习能力,机器人就拥有了类似人类的模仿学习能力,智能机器人通过自主学习获得具有切实的类人的智能行为能力,这是机器人的终极理想状态。写字机器人模仿学习主要是通过人手牵引,与机械手臂相互协作使之获取相应汉字信息,最终实现书写。Toru Tsumugiw提出了一种基于延时定位的人机交互的可变阻抗的控制方法[4],由压力传感器实时获取操作者手臂前端的力度,使机器人末端传感器实时获取压力和位置数据,实时获取压力与位置数据,使人机协作系统更加稳定。Andre Lemme[5] 以人形机器人iCub为平台,构建了一个运动基元库,通过人类的引导能够自监督地从复杂轨迹中感知并学习运动基元,学会相应的轨迹动作,并能使用复杂的手写轨迹进行评价。
另一种模仿学习的方式就是通过观察和模仿人类,获取对应的汉字信息并进行汉字的书写。例如V. Mohan等人[6] 以婴儿人型机器人iCub 为平台,通过综合系统学习绘制从简单到复杂的形状图案,即通过观察示范者的动作,特别是示范者末端执行器的轨迹,来学习模仿示范者的动作。在此基础上,也有研究者通过观察人的手势来实现机器人手臂的书写。通过运动传感器输入设备实时捕捉示范者的手势轨迹,采用简化的分类集成器识别人体不同的动作手势,来控制机械臂书写不同的笔画,最终实现整个汉字的书写。
4 结束语
目前写字机器人汉字信息提取技术主要是字库提取和机器视觉提取,模仿学习技术还不是很成熟,写字机器人的应用面也比较窄。随着计算机技术、图像处理技术、传感器技术和人工智能技术的不断发展,写字机器人必将从只能重复单一工作发展为像人类一样能模仿学习,并能随着经验的积累自动提高性能,甚至可以自我创作书法。强调机器人的自主学习方式,研制能够使人类的生产生活发生深刻变革的具备“通用智能”的机器人,无疑是机器人未来的发展方向。
参考文献:
[1]何薇,钱增磊 等.基于机器视觉的机器人写字技术的设计[J].江南大学学报(自然科学版).2011,10(5):513-516
[2]曾华琳,黄雨轩,晁飞,周昌乐.书写机器人研究综述[J].智能系统学报,2016,11(1):16-26..
[3]王光建,梁锡昌.写字机器人的文字矢量化及应用[J].现代制造工程,2004(7):40-42.
[4]TSUMUGIWA T,YOKOGAWA R,KHARA R.Variable impedance control based on estimation of human arm stiff-ness for human-robot cooperative calligraphic task[C]//Proceedings of IEEE International Conference on Robotics and Automation.Washington,DC,USA,2002:644-650
[5]LEMME A,REINHART R F,STEIL.J.J.Self-super Vised bootstrapping of a movement primitive library from complex trajectories[C]//Proceedings of the 14th IEEE-RAS International Conference on Humanoid Robots(Humanoids).Madrid,2014:726-732.
[6]MOHAN V,MORASSO P,ZENZERI J,etal.Teaching a humanoid robot to draw’Shapes’[J].Autonomousrobots,2011,31(1):21-53.
(作者单位:1石家庄学院机电学院;2陆军工程大学无人机工程系)