在线草图理解技术研究

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:zuhai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手绘草图是一种自然而直接的思路外化和交流方式。用户传统使用草图的方式为先用草图记录早期想法,想法成熟时转化为正规电子文档,这样存在着冗余性和低效性的问题。随着笔计算设备的普及,数码笔、手写板、手写屏、电子白板、PDA、UMPC等设备不断融入人们的生活,在线手绘草图将成为笔计算设备的主要应用之一。近年来,手绘草图也开始在互联网上出现,成为用户体现个性的方式。理解在线手绘草图将为手绘草图的高效利用和高效编辑提供了保障。   草图理解包括在线草图理解和离线草图理解。在线草图理解的对象为用户用数字笔绘制的在线草图,而离线草图理解的对象为图像。目前,在线草图理解技术是当前的研究热点,但它仍然面临很多挑战,例如草图的自适应识别、新领域草图的理解、草图的高效交互等。本文的研究对象为在线草图理解技术以及面向在线草图理解的交互技术。具体地,从多个层次和角度展开研究,依次为:草图符号识别、手写公式理解、草图结构理解、面向在线草图理解的交互技术、原型系统。   本文首先概述了草图理解技术的发展历史,介绍了在线草图理解技术的需求、输入设备和关键技术,并分析了在线草图理解技术的研究进展。之后,本文对自适应的草图符号识别、手写无机化学公式理解、手绘概念图的结构理解这三个问题进行了讨论,并对面向在线草图理解的交互技术进行了分析,最后研发了一个原型系统IdeaNote。本文研究内容和创新点如下:   1.自适应的草图符号识别   在草图符号的自适应学习中,不同用户的训练样本数量可能不同,保持在不同样本数量下良好的学习效果成为需要解决的一个重要问题。本文提出一种自适应的草图符号识别方法,该方法采用与训练样本个数相关的分类器组合策略将模板匹配方法和SVM统计分类方法进行了高效组合。它通过利用支持小样本学习的模板匹配方法和支持更多样本学习的SVM方法,并同时利用草图符号中的在线信息和离线信息,实现了不同样本个数下自适应的符号学习和识别。评估表明,该方法可以在24类草图符号分别使用l到20个训练样本时具有较高的识别正确率和较好的时间性能。   2.手写无机化学公式理解   手写公式是人们学习和生活中的重要部分,本文提出手写无机化学公式的同步识别和异步识别方法。同步识别方法在用户书写无机化学公式的同时进行识别,异步识别方法在用户完成一个或几个化学公式的时候进行识别。两类方法均充分利用了无机化学领域的知识,具有较高的识别正确率。其中,异步识别方法的正确率为93.08%。基于手写无机化学公式的理解结果,可以支持无机化学公式的手写输入、多通道输入、自动错误检测和自动配平等。   3.手绘概念图的结构理解   草图结构理解是草图编辑和草图应用的基础。手绘概念图是思维产生和交流的重要工具,与正规形式的概念图相比更加自然且符合用户的纸笔习惯。本文提出一种手绘概念图的结构理解方法。它采用动态规划方法提取概念图中的节点和连线笔划块,通过图划分的方法降低图的动态规划的时间复杂度,在此基础上提取由节点、连线和节点连线关系组成的概念图结构。评估表明,该方法可以取得95.18%的节点和连线提取正确率,且概念图结构理解的时间满足实时性要求。   4.面向在线草图理解的交互技术   草图的交互技术对草图系统至关重要。本文提出手绘概念图的结构化编辑技术和基于语音和笔的多通道输入和纠错技术。其中,手绘概念图的结构化编辑技术,支持结构化的选择、移动、缩放和节点互换等编辑操作。评估表明,该结构化编辑方法比基于笔划的编辑方法更加高效。多通道交互技术包括基于语音和笔的多通道化学公式输入方法和基于语音和笔的多通道数学公式纠错方法。评估表明,基于语音和笔的手写数学公式识别纠错方法比基于笔的纠错方法取得更好的效果。   5.原型系统IdeaNote   笔记系统是笔计算设备上的重要应用。IdeaNote是一个基于数字笔的笔记系统。它支持数字笔迹的自由输入,并支持笔迹的高效编辑。IdeaNote的基础为在线草图理解技术和面向在线草图理解的交互技术。在线草图理解技术包含笔手势识别方法、支持小样本学习的草图符号识别方法、列表结构理解方法、手绘概念图的结构理解方法和手写公式理解方法。面向在线草图理解的交互技术包括结构化编辑技术和多通道交互技术。另外,系统包含一个用于操纵笔迹的笔手势集合。
其他文献
网格系统软件的迅速发展使得越来越多的网格应用随之出现,对网格资源的需求日趋多样化和复杂化。同时,由于网格的自治性等特点,同一种资源在不同的管理域中会存在不同的特征描述
稠油由于其粘度高、密度大、流动性差,因此产出比很低,如何能够提高稠油的产出比一直是各大油田非常重视的问题。本课题来源于最早实行稠油开采的辽河油田特种油公司,主要研
流量测量分析通过捕获链路流经的数据包,获得不同协议层次的流量与性能指标,为网络体系结构与协议研究、网络系统设计规划、网络管理与运维提供重要依据。随着互联网体系结构演
随着EAST(Experimental Advanced Superconducting Tokamak)托卡马克实验装置的不断升级和等离子体放电参数的不断提高(LHCD和NBI加热功率分别达到了3.5MW和2.6MW),获得的等离子体
近年来,随着分布式数据库系统在各个领域的广泛应用,越来越多的高校和企业构建了自己的数据中心,以集成单位内部各部门的数据,解决制约单位信息化建设的“信息孤岛”问题。而如何
随着因特网的快速增长,许多的新型应用不断涌现,并且很多应用对于网络传输服务质量的需求越来越强烈。然而,起源思想简单、处理方式单一的IP路由体系已经很难适应越来越苛刻的业
实践十号卫星上搭载了众多载荷,用于进行空间科学实验。为保证载荷的可靠性,在发射之前,需要进行大量的地面匹配实验。本文设计实现了一套控制系统仿真软件,用于载荷地面实验
IPv6协议簇中路由协议的正确性保证是下一代互联网研究的重要课题。一致性测试是一种有效地检验其实现正确性的方法。由于IPv6路由协议具有行为与消息相互依赖的特点,集成数据
编译优化是现代编译器不可缺少的重要功能。编译优化技术在过去几十年里取得了显著进展,对提升程序运行速度、节省存储空间、节省能耗等起到了不可替代的作用。然而,编译优化的
无监督学习是机器学习中的一个经典任务,主要包括聚类和降维技术。近年来,谱聚类和谱嵌入方法由于其卓越的性能和完整的理论框架,受到了研究者密切的关注,并成为现代无监督学习方