印刷体朝鲜文识别方法研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:nofeeling189
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
朝鲜文是一种由辅音和元音基本字母构成的文字,它跟汉字有很多相似之处,因此汉字识别中用到的一些理论也可以应用到朝鲜文识别中。朝鲜文根据元音字母类型和后辅音的有无可以分为6种结构,理论上可以组成11000多个文字。朝鲜文中普遍存在相似字,这个特点严重阻碍了朝鲜文识别技术的发展。为了减少识别文字的复杂度,本文提出了一种基于字母的识别方法。本文在粗分类候选字的基础上,利用背景细化方法分离出构成文字的基本字母,然后提取两层外围距离特征,通过神经网络和结构分析识别字母,并根据候选字的实际情况以及朝鲜文的组成特点,对朝鲜文细分类进行了研究。另外,在现有的朝鲜文单词统计表的基础上,对识别后处理进行了实验,并取得了比较好的效果。下面列出了本文的主要工作: (一)分析朝鲜文文字结构特点,利用垂直方向、水平方向投影直方图法确定背景细化区域,通过对这些背景区域进行细化处理,得到字母之间的分割线并分离出了每个字母。 (二)从分离出的字母提取两层外围距离特征,以这些特征向量为输入建立了三层即神经网络。然后利用神经网络和结构特点识别字母,分析现有的印刷体朝鲜文识别系统给出的候选字组来判决识别文字,对经常用到的4种印刷体朝鲜文相似字候选组进行了识别研究。 (三)初步地建立了一种识别后处理系统。利用双方向搜索方法,从朝鲜文单词统计表中检索主体词和附加词,并把句子中识别错误的单词修正过来,对识别系统有一定的改善作用。
其他文献
全向视觉是一种新兴的视觉技术,由于全向视觉的大视场,人们很快将这项技术用在了机器人足球世界杯RoboCup的赛场上.本文在比较了当前全向摄像机镜面投影变换方法的优缺点后,
近年来,随着微电子技术、网络技术的迅猛发展,微控制技术在电力机车中得到广泛应用,使得电力机车逐步发展成为一个多微机控制的分布系统。本文在对原有的机车有触点控制电路
本文阐述了基于IP技术的USB-AHB桥的设计与实现,该桥是一款802.11B芯片中的子模块,该桥用于802.11B芯片系统中,使芯片基于该桥与USB主机进行通信。 论文首先研究了USB协议,介
软计算为开展移动机器人的智能研究提供了新的手段和挑战。本文以一种全方位移动机械手为背景,结合中国科学院百人计划项目“智能控制方法及应用研究”和科技部国际科技合作重
机器人视觉是机器人领域的一个重要研究方向。本文结合国家“863”计划机器人技术主题项目“MEMS微装配机器人”和“宜人化双臂操作型服务机器人”,针对基于视觉伺服的机器人
在这个信息爆炸的时代里,我们所能接触到的信息成指数级增长。为了方便人们以最快速度获取信息,文本语义相似度(Semantic Textual Similarity, STS)研究的应用领域不断扩大,
无人水面船具有模块化设计、小巧机动以及隐蔽性好等特点,能够满足不同的海洋作业任务需求,在现代海洋开发和作业中扮演着至关重要的角色。无人船已被广泛应用在搜索、救援、
本论文的研究工作主要围绕中药生产提取工段自动化智能控制系统的研制开发而展开,涵盖了中药提取工段工作机理的研究,中药提取工段特种传感技术及特种阀的研究,提取工段控制方法
在供应链管理环境下,合作伙伴关系的构建是目标供应链研究的热点问题。本文针对供应链中的不合作行为,主要利用博弈论和信息经济学的原理和方法,对构建双赢的供应链合作关系
线性调频连续波雷达由于具有结构简单、无距离盲区、高距离分辨力、低发射功率的优点,特别适合于防撞系统、目标特性研究、测量系统等领域,目前已受到国内外的广泛重视与研究。