基于词典的联机手写日文病名识别系统的研究与实现

来源 :贵州大学 | 被引量 : 0次 | 上传用户:wx9033016
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网的快速发展,平板电脑、电子书写板、各种数码笔等电子笔输入设备得到了广泛应用,用户能在更大的界面上自由地、无约束地输入文本信息。因此,联机连续手写字符(即字符串)识别研究成为字符识别领域中的一个研究热点。  本文对联机手写病名这一特定的字符串识别进行研究。借鉴一些成功应用于脱机手写地址字符串识别的方法,本文依据病名数据特点,采用词典驱动的方法对联机手写病名识别进行研究,并实现了一个专门的联机手写病名识别系统。主要对以下方面作了研究:  (1)基于电子手写板的数据样本采集,包括版式的设计、数据样本采集、采集样本数据的去噪和平滑预处理。  (2)对联机手写病名中的笔划进行特征提取,用支持向量机(SVM)对提取特征进行分类处理。并尝试用另一种分类器——核非线性分类器(KNR)对笔划进行分类处理,比较了两种分类器对笔划分类的效果。  (3)研究了词典驱动的联机手写病名识别方法。病名词典以树结构存储,包含21,713条病名短语。在切分中,手写病名字符串通过分析相邻笔划之间的空间信息等特征被切分为原始的片段序列。连续的片段动态地合并为候选字符模式,不同的合并方式产生不同的候选字符序列,这样可构成一个切分候选网格。在识别过程中,结合病名词典匹配来限制候选字符模式的类别扩展,采用集束搜索策略来寻找一条最优路径作为识别结果。实验结果表明该识别方法是有效的。
其他文献
在智能交通系统中,城市道路交通是比较重要的组成部分。城市道路交通系统的最大特点是道路交叉口较多,且通过交叉口的车流之间相互影响较大,使得交叉口的通行状况直接影响道路拥
AVS1-P2是中国音视频编码标准(简称AVS)工作组发布的最新的视频编码标准。它采用了运动补偿混合编码框架,在该框架下,帧内预测与帧间预测均在编码端完成,用于消除空间和时间
随着时代的发展,各种信息呈爆炸性增长,因此信息检索技术在处理信息资源时显得尤为重要。但随着传统的基于关键词的信息检索的弊端逐步暴露,检索的结果往往无法满足用户的需求。
随着网络技术的广泛应用,电子商务、电子政务、网上银行等网上交易也得到了迅速发展。在进行各种网上交易时,网络上信息的安全问题成为人们关注的焦点。CA负责为这些网上交易签
DCS(分布式控制系统)在现代工业现场已经运用多年,虽然近些年来不断受到新的控制系统的挑战,但是其庞大的市场应用以及随着技术进步不断提出适应新的需求的发展方向,必将使其
随着网络技术的发展,Agent以及多Agent系统(Multi-Agent System-MAS)已经成为研究的热点。由于Agent的自治性、智能性等特点,利用它可以为系统的集成提供一个崭新的途径,实现
脊波双框架系统是一种基于脊波的新的图像表示系统,它继承了脊波的核心思想即将空间中的“线奇异”转化为“点奇异”,再用小波变换处理这些点奇异,同时,它克服了以往用于图像
传统的GIS信息资源被扩展到互联网上,这为不断增长的GIS用户需求提供了丰富的数据资源。随着越来越多符合规范的稳定易用的空间信息服务被发布到网络上,如何有效地获取、管理
现代快速发展而多变的商务环境,要求企业级应用系统能够迅速适应不断变化发展的业务需求,从而适应新形势下的业务战略的快速部署,而传统的业务解决方案已无法满足这种需求。
利用三维重建技术获取场景3D几何结构的建模方式,能够摆脱传统三维建模繁琐的人工交互模式,使得三维建模过程变得更为简单方便。并且在3D电影,电子游戏,以及三维测量等领域有