数字笔迹的结构分析与识别

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:liongliong502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字笔迹,是指由笔输入设备产生的带有空间、时间和压力等丰富属性的在线笔画数据,它随着基于“纸笔”隐喻的笔式用户界面的兴起而诞生,并得到了广泛的关注、研究和应用。数字笔迹是一种自然、快捷的信息采集和利用的方式。在使用数字笔迹的笔式用户界面中,用户既能书写模拟物理纸笔效果的笔迹,又能让计算机理解识别笔迹,高效地存储与传输笔迹,快速地检索笔迹,获得物理纸笔没有的便捷。作为重要的使能技术,数字笔迹的计算技术为笔式用户界面的自然性和高效性提供了保障。   在各类数字笔迹计算技术中,笔迹的结构分析技术非常重要,正是它赋予了笔式用户界面智能,让计算机能理解用户输入的笔迹,获得笔迹的结构化表达,为笔迹的结构化编辑和向规范数据的转换打下基础。本文研究正是基于这样的思路而开展的。本文首先概述了数字笔迹产生的背景、数字笔迹的构成和笔迹计算技术,特别分析了数字笔迹结构和及其分析与识别的相关研究。之后,本文对数字笔迹的多方向行提取、图文分离、流程图结构理解这三个问题进行了讨论,对手写文字笔迹识别错误的多通道纠错方法进行了分析,最后研发了一个笔式智能白板会议系统。本文研究内容和创新点如下:   1.数字笔迹的多方向文本行提取方法;   文本行是一种重要的文本笔迹结构,然而由于笔迹内在的不规范性,多方向的文本行结构并不易提取。本文提出了一个基于视觉感知的多方向数字笔迹文本行提取方法。该方法采取自底向上的策略,首先将在空间和时间上邻近的笔画组成笔画块,然后基于这些笔画块建立链接模型,用来评估潜在的行排列结构,最后采用分支限界搜索找出最优行排列。实验表明,该方法能有效地提取数字笔迹的多方向文本行结构,并适用于弯曲文本行的提取。   2.数字笔迹的图文分离方法;   人们书写的笔迹经常同时包含文字和图形。本文介绍了一种数字笔迹的图文分离方法。该方法认为,图形笔迹是不具备合理文本排列的笔迹。因此该方法首先利用笔迹的文本分析技术,将笔迹文本结构化,然后以笔画块为单位,提取该笔画块自身的特征和其周围的文本排列特征,再利用SVM分类器,将每个笔画块分类为文本或者图形。与另外三种图文分离算法的对比评估表明,该方法的分类效果较好,适用于非特定领域数字笔迹的图文分离。   3.数字笔迹中的流程图结构理解方法;   流程图具有丰富的空间信息结构。本文提出了一种数字笔迹的流程图结构理解方法。该方法首先利用单个笔画及其空间时间的上下文特征,采用SVM分类器将流程图中的文字笔画和图形笔画区分开,然后利用图搜索算法和顶点染色算法,从图形笔画中找出流程图的“容器——连接符”结构,最后将文字笔画填充入此结构,从而完成流程图结构理解。本文还提出了利用笔手势纠正流程图识别错误的方法,以及基于结构化的流程图的结构化编辑操作。评估表明本文算法能有效提取笔迹的流程图结构,其结构化编辑自然高效。   4.连续手写汉字识别的多通道纠错方法;   在采用手写识别的系统中,用户满意度不但由识别率决定,而且还受识别错误纠正过程影响。本文提出了一种基于语音复述的多通道连续手写识别错误纠正方法。该方法不但可以纠正字符识别错,还可以纠正字符提取错。该方法的核心是一个多通道融合算法。该算法通过利用用户语音约束最优手写识别结果的搜索,从而达到纠错目的。评估表明,该融合算法能有效纠正上述两类错误;与另外两种手写识别错误纠正方法相比,本文提出的方法具有更高的纠错效率。   5.笔式智能白板会议系统;   白板是一种在许多场合使用的信息交流的工具,本文介绍了一个基于电子白板的笔式智能白板会议系统。该白板系统面向办公人群,用于非正式的会议交流。用户能通过笔式交互,准备白板提纲,进行会议。当会议结束时,用户能将书写的笔迹整理为正式的会议记录。该白板会议系统基于笔者主导开发的笔迹计算工具包(InkLib),使用了大量笔迹计算技术,保证了自然高效的白板交互过程以及便捷的白板笔迹整理过程。
其他文献
图像的多尺度表示是一种类似于人类视觉系统的图像分析方法,目前得到了人们广泛地关注。客观世界中物体的特征表现在某一特定的尺度范围内,在不同的尺度下,人类视觉感知所获
随着技术的发展和人们需求的增加,图像视频信号的质量和精度日益提高,所获取的数据量也是越来越大。因此关于图像视频的编解码技术的研究,得到了长期的关注和发展。压缩感知理论
随着经济的发展、人民生活质量的不断提高,智能化小区的规划设计与建设在很多地区已渐成热点,安防产业的市场前景越来越被看好。作为安防一部分的可视对讲系统的数字化已经成为
随着社会的发展,企业业务已经进入了“随需应变”的时代。为了适应企业业务的这一特点,提高企业的综合竞争力,一个可行的途径是将企业内外部的各类业务应用系统及各类信息进行适
移动对象数据库技术 (Moving Objects Database,MOD) 近年来受到了越来越多的关注,已成为当前数据库领域的研究热点。与传统数据库不同,MOD技术主要研究移动对象位置及其相关信
以实时多媒体数据通信为代表的宽带网络应用已逐渐成为互联网承载的主要应用及流量类型之一.在这些应用中,有相当一部分具有群组通信的性质,为了节约带宽资源,提高转发效率,
随着视频摄像机的普及,使得各种类型的视频数据数量飞速增长。基于视频序列的人体行为识别技术已成为计算机视觉、模式识别领域的重要课题,基于视频序列的人体行为识别主要通过
当电子器件应用在辐射环境下时,粒子流会与器件材料相互作用,使器件产生辐射损伤。该损伤导致器件电气特性发生改变,引起集成电路发生功能失效等不期望的工作状态。在军用、航天
软件失效在软件程序中很常见。为了保证程序的可靠性,错误需要被定位并消除。错误定位是软件调试过程中最重要和最困难的任务之一。错误定位的一种流行方法是基于统计的定位,它
当前,国家大力推动核心元器件国产化,以实现自主可控,XX处理器应运而生。XX处理器是一款适用于无线通信、雷达信号处理等领域的全新的具有自主知识产权指令集体系结构和微体系结