基于网格的无字库智能造字研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:a63421118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪是信息时代,而语言文字计算机化是信息化的主要内容之一。经过近20年的努力,中文信息化在中国经济建设和社会发展中发挥着越来越大的作用,已经产生出巨大的经济效益和社会效益。但到目前为止,我国和国际组织研究开发的中文底层软件都是基于字库方式的。 在对现存汉字字库方式进行简要述评的基础上,提出采用汉字部件按照一定规则来进行拼部组字的构想,本文详细讨论了智能造字的总体方案。 汉字的复杂性在于汉字结构复杂,汉字部件在汉字成字中的位置、形态和大小都发生变化。为了解决汉字造字问题,必须要解决造字工具问题。本文对文献[1]提出的网格方法进行了深入的研究和探讨。 汉字部件聚类的设计、利用部件进行网格拼组的设计,并简要介绍了汉字输入和自适应形变的设计。 分析汉字造字的核心是分析汉字部件,利用汉字结构和部件在汉字中的位置和大小对汉字部件进行聚类分析,聚类后的个别汉字部件类别达到200多种,通过对部件聚类的合并可行性进行分析,利用认识模式识别的理论,提出了利用人认知汉字的特点,对相似位置、相似大小的汉字部件进行类别合并,将这些类别合并到部件大小和位置适中的情况,合并后的汉字变形基本在人认知的范围,从而减少每种部件类别到100种以内。 为了实现计算机的智能造字,本文参考文献[2]在利用网格将汉字部件根据聚类的结果进行拼组作了一些探索,提出了利用结构和部件读音进行输入、对标准汉字部件进行自适应形变以生成符合要求的汉字部件、利用部件聚类结果进行网格拼组汉字。
其他文献
城市供水系统的正常安全运行是该地区得以持续发展的基本要素之一,而地下输水管线漏损现象的频繁出现不但会引发水资源的浪费,也给国民经济造成一定的损失,甚至会威胁到生命财产
在网络时代,信息的交流越来越频繁,信息安全日益重要。信息安全技术主要包括信息的保密性、完整性、可用性及可控性。本文提出了一种基于指纹认证的动态加密方法,能在不影响用户
本文对基于DDS的锁相放大器进行了研究。文章介绍了微弱信号的检测方法、检测原理,总结了锁相放大器的发展历程和发展方向,交代了系统研制的背景,给出了系统研制的目的和意义。
随着嵌入式、半导体和Internet技术的飞速发展,基于Internet的嵌入式Linux远程图像监控系统正成为新的研发热点。 本文将嵌入式系统开发技术与网络技术相结合,实现了嵌入式
本文针对我国正在研制开发的远程自治潜水器的特性及其对航行控制的要求,进行了以下研究:自适应模糊PID控制方法和单神经元自适应PID控制方法在航向控制回路的应用研究,以及沿规
在钢铁冶金、石油炼制、化工、电力、热能等高成本费用、高安全等级的工业过程,随着人们对过程的高效性、产品的高质量和自动控制系统的集成化有着越来越高的要求,过程监测、
学位
早在1920年,“机器人”一词已经开始流行起来了。然而人们对机器人的幻想和追求已达几千年了。随着60年代初机器人技术的问世,经过了40余年的发展,机器人已取得了长足的进步。作
生产调度是现代制造业生产管理的核心内容,是控制生产成本,提高生产效率,提升产品质量与服务水平的关键要素。当前,针对炼钢-连铸生产调度的研究大部分是基于静态生产环境。
随着医学影像处理与分析学科的发展,在医学影像的图像分割领域中出现了很多新的方法。但是其中的许多方法都专门应用于特定的处理对象,对于一般对象并无通用的理论或方法,并