《汉语大字典》(第二版)收字的数字化研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:dl612
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
《汉语大字典》是我国目前收录楷书单字最多,释义最全的代表性字典,其第二版在第一版的基础上做了修订和增补,成为汉字用字的最新典范,具有极其重要的意义,因此对其字头进行数字化整理,可推动这一代表性字典的传播和使用。本文通过对已有数据库的整理,发现了《汉语大字典》第二版中5287个在目前条件下尚无法实现数字化的字头。经分析有607个字头属于新旧字形的问题,对此本文提出的解决方案为选取一个基础字库Sun-Ext B,找出此607个字头在字库Sun-Ext B中所对应的或新或旧的字形,并在相同的码位上将其替换成字典字形,形成一个替换字库,这样即可实现这607个汉字字头的正常显示。同时,通过与GB18030-2005的对比,发现有4680个汉字字头尚未被收录进当前国家标准字符集中,对此本文采取新造字库的方法,以实现这些字头的数字化。在实现《汉语大字典》第二版字头的数字化过程中,本文发现了两个前人尚未涉及到的《汉语大字典》本体问题,一是形同而音义不同的四组字头;一是《汉语大字典》第一版收录而第二版未收的12个字头,本文将分别对它们进行分析和探讨,并提出计算机处理的方法,包括对字符进行加注、字符替换和新造字等,最终实现《汉语大字典》第二版所有字头的数字化。
其他文献
以铝镁浇注料为研究对象,对添加不同镁砂细粉含量(质量分数分别为4%、6%、8%、10%)以及不同组分的尖晶石(分别为富铝、理论、富镁尖晶石细粉,控制MgO的含量不变)的浇注料试样,测试了
复杂多变的业务需求已经使软件开发面临巨大困难,当对象管理组织提出用模型驱动体系结构(Model-Driven Architecture,MDA)来解决这一难题后,模型驱动的软件开发就成了软件工程领域
采购行业在最近几十年的发展中有了快速的提升,毫无疑问,企业的采购战略已经成为企业战略性决策的重要组成部分。在最近三十到四十年的发展中,采购已经从传统的服务角色逐渐演变
我国“十三五”规划纲要中提出实施制造强国战略,要深入实施《中国制造2025》,以提高制造业的创新能力,培育制造业的竞争优势。在沪全国人大代表“大力提升产品质量品牌,加快
脑裂头蚴病是由曼氏迭宫绦虫引起的人兽共患寄生虫病,由其幼虫—曼氏裂头蚴引起。曼氏裂头蚴可在体内移行,并侵犯多种组织器官及中枢神经系统,产生的临床症状远较成虫严重。该寄
本文把主体意识的自我意识作为自我意识的终极内蕴对待,依托认识与实践的关系,从人与自然、个我与群我、生理与心理、内在自我与对象世界以及己内世界自身的矛盾分析中,深入揭示
異體字研究是漢字整理與規範工作當中十分重要的一個環節。本文綜合漢字構型學理論並在此理論指導下將漢字構型與字用結合起來,推論出漢字異體字的定義為:漢字史上為記錄同一
介詞是漢語語法體系中的一個重要的詞類,歷來受到學界的關注和重視。《列女傳》是我國第一部脫離經紀獨立成書的單形體傳記著作,也是我國第一部婦女專史,具有重要的思想和學
文章从报纸市场竞争的双重效益要求出发 ,针对目前我国报纸普遍缺乏市场化的产品设计意识和可行性的产品设计新思路现状 ,提出一种市场化的、指向适销对路的、可行性强的产品