【摘 要】
:
字符识别是模式识别领域的重要研究方向。目前,其主要的研究方法大都是基于统计学的,研究者需要搜集大量的标记样本进行训练,然后生成分类器进行分类,这样耗费大量的时间与人
论文部分内容阅读
字符识别是模式识别领域的重要研究方向。目前,其主要的研究方法大都是基于统计学的,研究者需要搜集大量的标记样本进行训练,然后生成分类器进行分类,这样耗费大量的时间与人力。因此,本文在基于主动学习与支持向量机理论的研究基础上,引入了主动学习与支持向量机相结合的字符识别方法。与以往的识别系统不同,它不需要人工去标记所有样本进行学习训练,该系统能够向用户询问训练过程中的不确定样本,在与人们沟通的同时,不断完善自身的识别效果,而且系统不需要将所有样本训练完,这样一来就减少了人工标记样本的工作量。另外系统还能够不断地通过询问进行学习更新,提升系统识别的效果。文章先介绍了研究所需要的理论知识。从一般的光学字符识别过程入手,针对字符识别的重要环节——预处理和特征提取展开研究。根据支持向量机和主动学习的原理,引入了主动学习SVM相结合的思想,并将此方法应用到光学字符识别软件中去。本文采用大量字符数据,通过试验验证了此方法的可行性,并利用其原理实现了一个简单的,基于主动学习SVM的字符识别软件。
其他文献
无线传感器网络是一种由大量多跳的传感器节点构成的自组织网络,在环境保护、灾害监测和军事防御等领域有很大的应用潜力。在采用传统的分层网络体系结构下,MAC层协议在无线
自动问答系统允许用户输入自然语言问句,并返回简洁而准确的答案,相对于搜索引擎输入关键词并返回文档列表的工作模式,既有利于用户更清晰地表达检索意图,也具有更高的效率,
随着嵌入式技术的普及,各种智能设备都具有了嵌入网络的功能,以便实现远程监控。这些设备包括各种工业设备、医院病房中的医疗设备、家电设备和某些移动设备(如公交车)。一般
随着数值天气预报模式分辨率不断提升,计算量随之迅速增长,对超级计算机的计算性能需求也随之上升。而传统的CPU处理器架构由于摩尔定律的限制,计算性能的增长陷入瓶颈,针对
随着计算机与网络技术的普及应用,信息安全已经成为关系到国家安全的关键因素。操作系统是整个信息系统安全的基础,如果不经过安全测评,操作系统的安全性就得不到保障。而且
本体最初是一个哲学概念,用来描述事物的本质。在本世纪80年代,科研人员把本体引入人工智能领域,并赋予其新的含义。在计算机科学领域,本体被定义为共享概念模型的形式化规范
科学与工程应用对计算性能要求的不断增加使得机群系统得到了迅速发展,但由于功耗和散热等因素,基于CPU的同构机群系统可拓展性已成为发展瓶颈。而图形处理单元(GPU)、众核协
随着信息技术在新药创制中的不断成功应用,以多样性分析为基础的计算机药物虚拟筛选成为当前新药研究中克服化合物数目不足对新药创制的制约的重要技术手段,基于结构的分子对
随着布料模拟技术在计算机动画、纺织服装CAD和虚拟试衣系统中的广泛应用,模拟效率的要求日益提高。而布料模拟系统中的碰撞检测部分的检测速度正是模拟效率的重大瓶颈。因此,
近年来,随着计算机网络技术的发展,网络数据库的应用日益广泛,网络数据库系统的安全问题也由此引起人们的普遍关注,如何保证网络数据库中数据的安全性,己成为一个迫切需要解