俗字字形描述方法研究

来源 :南京师范大学 | 被引量 : 3次 | 上传用户:tony_m_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字的输入与输出问题一直是汉字信息处理关注的焦点,俗字作为汉字中较为特殊的一类,其输入与输出问题更是受到汉字信息处理领域和文字学领域的双重关注。但是,长期以来,汉字的处理都以字符编码的形式对整字进行输入与输出,这种方法不仅不利于分析汉字字形的内部结构,其封闭性更是大大限制了字符集的扩展,使得俗字这类编外字符的输入与输出成为难题。为了更好地解决俗字字形的计算机处理问题,方便字形结构和部件等数据的统计分析,本文借鉴现有汉字字形描述方法,在考察俗字字形讹变特点的基础上探究俗字字形的形式化表示方法。本文俗字字形描述方法的基本思路是以正字字形表达式为平台,在此基础上对俗字字形结构和部件的讹变情况加以形式化表示。其中,正字字形表达式又以结构和部件为基本参数,利用R<a,b>这一形式化表示方式将末级部件用分析获得的十七种结构关系联系起来,之后再通过不断递归,最终生成正字字形表达式。俗字字形的描写则以此为基础,分两步进行,首先是保留讹变部件具体形体的预标注,之后再在正、俗字讹变部件表的辅助下,用正字部件形体加编号的形式指代相应讹变部件,以完成俗字字形的最终描写。前后两次俗字字形描写中,结构关系的变化都以替换(→)、添加(+)、省略(V)和移位(*)四种关系变化符来表示。利用确定的俗字字形描述方法,本文对《干禄字书》中641对正、俗字字对和《敦煌俗字典》中3349个正字及其对应的7635个俗字进行了标注,形成了相应的正字字形表达式和预标注的俗字字形表达式,并以此为字形资源,利用自定义算法自动获取了相应的正、俗字讹变部件对,之后再通过对所获部件对的独立性、自由度、与字内其他部件联系的紧密程度以及正、俗字部件间的相关性等情况的进一步分析确定最终讹变部件对,形成正、俗字讹变部件表。并通过对表中数据的考察与分析,发现了俗字字形讹变的部分规律。另外,又以正、俗字字形表达式为基础,分别获取了491个正字基本部件和766个俗字基本部件。本研究中俗字字形结构和部件等相关数据的统计与分析能够为俗字讹变规律的探究提供假设。而整理所得的正、俗字讹变部件对则从字形上为俗字对应正字字形的推断提供思路。
其他文献
我国历来就有编修地方志的传统,河南地处中原,编纂方志的历史悠久。自明以来,河南首次编修省志,明清时期共有七部通志流传于世。七部通志基于不同的编纂背景,在体例上不断完善,内容
作者投稿请登录本刊网站(http:∥www.chvm.net)在线投稿。1论文内容刊登畜牧兽医科学研究论文和文献综述。文稿务求论点明确、材料翔实、数据可靠、评价客观、文字精练,内容
<正>1病情介绍患者中年男性,39岁,工人,腰及左下肢疼痛麻木月余,加重一天。患者于一月前劳作时出现腰痛、左下肢疼痛症状,伴麻木,卧床休息后缓解。一周前因劳作加重,在外院被
找准一个支点,就能撬动地球,这是哲人的表达;紧扣春运民生需求,释放最大运能惠及所有旅客,是铁路服务社会最好的表达。$$2017年春运即将到来。日前,中国铁路总公司提出了“平安春运
报纸
<正>【条文】第八十八条收受可能影响公正执行公务的礼品、礼金、消费卡和有价证券、股权、其他金融产品等财物,情节较轻的,给予警告或者严重警告处分;情节较重的,给予撤销党
目前我们的对外汉语教学研究主要是侧重成人,关于儿童对外汉语教学方面的研究还比较少,还没有形成完整的体系,专门研究儿童对外汉语教学设计的就更少了,因而本论文基于笔者自
目的对比分析微创经皮锁定钢板内固定术与传统切开复位解剖钢板内固定术治疗胫骨骨折的临床效果。方法 80例胫骨骨折的患者,根据手术方法随机分为对照组和实验组,各40例,对照
目的:探讨金银花多糖(FLP-3)对卡介苗加脂多糖(BCG+LPS)致小鼠免疫性肝损伤的影响。方法:将72只昆明种小鼠按随机数字表法分为正常组、BCG+LPS免疫性肝损伤小鼠组(模型组)、
分段沉积/雕铣成形是一种堆积成形与传统成形相结合的复合成形方法,同时具有堆积成形的柔性和传统成形的高精度,既吸收了快速成形中的离散堆积成形思想,又继承了传统机械加工的优