论文部分内容阅读
数字笔迹,是指由笔输入设备产生的带有空间、时间和压力等丰富属性的在线笔画数据,它随着基于“纸笔”隐喻的笔式用户界面的兴起而诞生,并得到了广泛的关注、研究和应用。数字笔迹是一种自然、快捷的信息采集和利用的方式。在使用数字笔迹的笔式用户界面中,用户既能书写模拟物理纸笔效果的笔迹,又能让计算机理解识别笔迹,高效地存储与传输笔迹,快速地检索笔迹,获得物理纸笔没有的便捷。作为重要的使能技术,数字笔迹的计算技术为笔式用户界面的自然性和高效性提供了保障。
在各类数字笔迹计算技术中,笔迹的结构分析技术非常重要,正是它赋予了笔式用户界面智能,让计算机能理解用户输入的笔迹,获得笔迹的结构化表达,为笔迹的结构化编辑和向规范数据的转换打下基础。本文研究正是基于这样的思路而开展的。本文首先概述了数字笔迹产生的背景、数字笔迹的构成和笔迹计算技术,特别分析了数字笔迹结构和及其分析与识别的相关研究。之后,本文对数字笔迹的多方向行提取、图文分离、流程图结构理解这三个问题进行了讨论,对手写文字笔迹识别错误的多通道纠错方法进行了分析,最后研发了一个笔式智能白板会议系统。本文研究内容和创新点如下:
1.数字笔迹的多方向文本行提取方法;
文本行是一种重要的文本笔迹结构,然而由于笔迹内在的不规范性,多方向的文本行结构并不易提取。本文提出了一个基于视觉感知的多方向数字笔迹文本行提取方法。该方法采取自底向上的策略,首先将在空间和时间上邻近的笔画组成笔画块,然后基于这些笔画块建立链接模型,用来评估潜在的行排列结构,最后采用分支限界搜索找出最优行排列。实验表明,该方法能有效地提取数字笔迹的多方向文本行结构,并适用于弯曲文本行的提取。
2.数字笔迹的图文分离方法;
人们书写的笔迹经常同时包含文字和图形。本文介绍了一种数字笔迹的图文分离方法。该方法认为,图形笔迹是不具备合理文本排列的笔迹。因此该方法首先利用笔迹的文本分析技术,将笔迹文本结构化,然后以笔画块为单位,提取该笔画块自身的特征和其周围的文本排列特征,再利用SVM分类器,将每个笔画块分类为文本或者图形。与另外三种图文分离算法的对比评估表明,该方法的分类效果较好,适用于非特定领域数字笔迹的图文分离。
3.数字笔迹中的流程图结构理解方法;
流程图具有丰富的空间信息结构。本文提出了一种数字笔迹的流程图结构理解方法。该方法首先利用单个笔画及其空间时间的上下文特征,采用SVM分类器将流程图中的文字笔画和图形笔画区分开,然后利用图搜索算法和顶点染色算法,从图形笔画中找出流程图的“容器——连接符”结构,最后将文字笔画填充入此结构,从而完成流程图结构理解。本文还提出了利用笔手势纠正流程图识别错误的方法,以及基于结构化的流程图的结构化编辑操作。评估表明本文算法能有效提取笔迹的流程图结构,其结构化编辑自然高效。
4.连续手写汉字识别的多通道纠错方法;
在采用手写识别的系统中,用户满意度不但由识别率决定,而且还受识别错误纠正过程影响。本文提出了一种基于语音复述的多通道连续手写识别错误纠正方法。该方法不但可以纠正字符识别错,还可以纠正字符提取错。该方法的核心是一个多通道融合算法。该算法通过利用用户语音约束最优手写识别结果的搜索,从而达到纠错目的。评估表明,该融合算法能有效纠正上述两类错误;与另外两种手写识别错误纠正方法相比,本文提出的方法具有更高的纠错效率。
5.笔式智能白板会议系统;
白板是一种在许多场合使用的信息交流的工具,本文介绍了一个基于电子白板的笔式智能白板会议系统。该白板系统面向办公人群,用于非正式的会议交流。用户能通过笔式交互,准备白板提纲,进行会议。当会议结束时,用户能将书写的笔迹整理为正式的会议记录。该白板会议系统基于笔者主导开发的笔迹计算工具包(InkLib),使用了大量笔迹计算技术,保证了自然高效的白板交互过程以及便捷的白板笔迹整理过程。