二十一世纪初汉语字、词流通频度统计

来源 :中国中文信息学会汉字编码专业委员会第八届年会 | 被引量 : 0次 | 上传用户:wangle2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了作者近期从5千余万字当代语料中对GB13000.1字符集20902字和88102条词语进行流通频度统计的结果.比用历史语料统计的使用频度有更大的实用价值.
其他文献
本文首先阐明了为什么要开展适应中小学教学用的编码研究,较详细的说明适应中小学教学用的汉字编码的特点.强调汉字编码应符合国家语言文字的有关标准和规范,最后指出汉字键
元根码是为解决汉字和特殊字符的信息化书写问题,在发展了汉字编码理论的基础上开发的新一代汉字输入方法.元根码立足于汉字博大精深的文化底蕴,依据国家语言文字规范,选定15
由于CAD软件的特殊性,点阵字库和曲线轮廓字库都不是合适的字体格式,本文将介绍一种专门为CAD软件系统设计、开发的一种字库技术—单线字库.
《华升汉字编码》简称《华升码》,是一种以阿拉伯数字为代码的,在《四角号码》基础上发展起来的汉字编码系统,编码的依据是汉字部首和字根,以产生单字或字组的代码、输入/输
本文首先回顾了中文输入法的三个阶段,提出对评价输入法应本着简单化、数字化、规范化的客观标准实事求是地衡量各种输入法的优劣.同时介绍了蓝联数码输入法.
自计算机发明以来,汉字集合的选择、组织形式、特别是汉字编码问题,曾长期困扰着中文信息科技的发展.直到八十年代初,正式确立的中文简体字国家标准(GB2312)后,中文信息才有
本文认为,汉字编码是"现代汉语"的重要组成部分,因此汉字编码,都应完全贯彻《汉语拼音方案》和《现代汉语通用字笔顺规范》的要求,在一个编码方案的原则下、简便易学、能成为
本文分析了现有形码类输入法和方位式输入法的分类及其特点,并结合实例(十笔字型系列输入法)探讨汉字编码的改革,旨给汉字输入法的研究和发展起到抛砖引玉作用.
自适应数字波束形成和盲信号分离算法是两种应用广泛的阵列信号处理算法.前者充分利用了信号源的空间方位信息,后者则主要依靠各个信号源之间统计独立的假设.在本文中,讨论了
本文尝试将系统分析方法用于IT术语的定名与评价,所采用的基本方法,一是集中拆分出基础要素—术语元,二是提出八项量化指标,并以此准则对术语集进行分析评价.同时文中建议开