论文部分内容阅读
【摘要】随着互联网普及和我国对汉字的逐渐重视,依靠排列组合原理,利用一种新的汉字输入法——拼音笔画输入法,解决重码和读音不准问题,科学构建汉字字库系统、汉字单字或多词组应用数据分析系统和汉字信息快速搜索系统,使汉字发展能更好地适应新形势所需.
【关键词】拼音笔画;数学;体系构建
一、数学聚集整合技术的应用
英国著名科学家李约瑟编撰的《中国科学技术史》一书,曾这样说过:中国是最早发明水排的国家,也是最早发明风箱的民族,但却没有把它们整合起来变成蒸汽机.其原因是没有最终把两者有机整合在一起.
说起蒸汽机,首先想到瓦特,但他并不是发明者.瓦特的重大贡献就在于技术改进,且运用数学原理,经过反复实验、计算得出运行效率高于以往四倍的结果,使蒸汽机性能大大提高,从而促进了第一次工业革命的兴起.下面介绍的拼音笔画输入法,就是利用了聚集、整合技术和数学方法构建的.
二、拼音笔画输入法
我们知道汉语拼音是由声母和韵母组合而成的汉字字音,而拼音笔画输入法是利用拼音声母与汉字笔画相结合来实现的.汉语拼音总共有23个声母,汉字笔画可分为五种:横、竖、撇、捺、折,可以用键盘数字1、2、3、4、5代替.每一个汉字都是由声母与笔画组合而成,根据数学中排列组合乘法定理,可以计算出总组合数来.现将乘法定理叙述如下:
完成一件事,需要将其过程分成几个步骤,做第一步有m1种不同的方法,对于第一步的每一种方法,做第二步均有m2种不同的方法;对于前两步的每种方法,做第三步有m3种方法……以此类推,做第n步,对于前(n-1)步的每种方法,均有mn种方法,那么完成这件事共有P=m1*m2*——*mn种不同的方法.
1.汉字的单字输入法
规则:取声母232取笔画53
笔画取法:上下结构的汉字取第一、第二笔画和末笔画;左右结构的汉字取左侧的第一笔画和右侧的第一笔画及末笔画;不够三笔的汉字用空格代替.
声母与笔画总组合数为:232*53=2875种
例如:汉 h454 字 z421
需要说明,不是每一种声母与笔画的组合都可以组成一个汉字,但是每一个汉字都是由声母与笔画组成,这里的总组合数为平均数.根据国家公布《通用规范汉字表》(2013版),共收录汉字8105个左右.假设每一个声母和笔画都可以组成一个汉字,那么平均重码率8105/2875≈3个汉字.从理论上来讲基本上满足我们使用要求,不翻页或少翻页找字,极大地节约了输入汉字的时间.
2.汉字的双字词组输入法
规则:取声母组合数232 取笔画组合数52
笔画取法:取第一个字的第一笔画与第二个字的最后一笔.
双字词组总组合数为:232*52=13225
例如:科学kx32 东西dx11
根据《现代汉语词典》词汇总量约六万条,其中双字词组不超过四万条,汉字平均重码率40000/13225≈3个字,同样也节省了汉字双字词组输入的时间.
3.汉字的三字词组输入法
规则:取声母组合233 笔画输入52
笔画取法:取第一个字第一笔,最后一个字末笔画.
汉字三字词组总组合数为233*52=304175
例如:俄罗斯 els32
汉字三字词组基本上不存在重码,大多不需要翻页.
4.汉字四字词组输入法
规则:直接输入声母,笔画输入基本上不需要采用.
四个字声母组合数234=279841
例如:一针见血yzjx 一心一意yxyy
五个字及其以上的词组(容量235=6436343)只要使用声母就可以完成汉字词组的输入,不需要再输入笔画,这样输入速度更加快捷方便.
三、拼音笔画输入法特点
从以上对汉字单字及词组进行计算与分析,得出规律为:汉语拼音的声母用来输入汉字或词组,笔画用来确定矫正每一个汉字或词组.当输入四个字及其以上的词组时,根据其组合容量,基本上不需要输入笔画,这样极大地减少了敲击键盘的次数,使输入词组更加快速方便.拼音笔画输入法还有以下一些特点:
1.减少敲击键盘的平均次数
以拼音输入为例,输入一个汉字,最少敲击2次键盘 (不算重码翻页)(壹yi),最多敲击6次键盘(状zhuang),平均输入键盘3.5次。
从上表中可以看出,采用拼音笔画输入法,敲击键盘的次数明显减少.
2.解决汉字读音不准的问题
地区方言差异较大,声母不易读准的音zh、ch、sh与z、c、s;韵母不易读准的音en、eng、in、ing,这些不容易读准的声母和韵母在汉字中占有很大比例,由于读音不准确,导致在拼音输入过程中输入速度受到影响.
3.解决汉字输入过程中的重码问题
无论是使用拼音输入法还是笔画输入法都存在大量的重码,但把两种输入法结合起来,就大大地降低了重码率,节约输入时间,从而使汉字输入更加简便、快捷.
4.加深人们对汉字字型的印象
汉字是语言与字型完整结合的产物,这是汉字文化固有特点,使用这种输入法,可以加深对中国传统汉字字型的记忆印象,加强对中国汉字书写与阅读的继承与发展,具有不可替代的意义. 5.推进汉字输入法的延伸和扩展
汉字的字形结构形式比较复杂,它不仅有上下、左右结构,还有许多字形结构形式,如里外型(国)、品字型(森)、倒品型(馨)及独体字型(凸、凹)等,为了减少重码,增加几个常用字根以及相对应的数码,使输入汉字更快捷.所增加的字根及数码键盘对应如下:
键盘0:口、日、目、月、田、罒等,此类部首占汉字总量16%~20%左右.
例如:国g014 、 启q450 、曼m004 、眼 y054
键盘7:七、土、士、扌、艹等,此类部首占汉字总量10%左右;
例如:草c702 、地 d757 、把b757、北b217
键盘8:八、乄、人、丷、灬.小等,此类部首占汉字总量10%左右.
例如:放f438 、然r348 、众z888、兑d805
增加的3个数码,其拼音与笔画组合数为:23*83=11776.重码率为8000/11776≈0.68%
四、建立与时俱进的汉字输入应用体系
汉字拼音笔画输入法被大家认同需要一个过程.但它应用数学原理建立起来的数学体系非常重要.马克思说:“一门学科只有当它达到了能够成功运用数学时,才能真正发展”.数学原理的引入为我们在工作中解决实际问题提供了理论依据,它揭示了事物内在规律,化难为易,把奥妙变为常识.为此,拼音笔画输入法的应用又进一步拓展了空间.
1.建立属于自己的汉字字库系统
由于每个人使用汉字的用途及专业分类领域不同,使用汉字单字和词组的频率也不尽相同.因此,有必要组建属于自己的汉字字库系统,从字库系统中提炼出属于自己的汉字字库,再结合汉字输入过程中的联想功能和学习记忆功能等,以便更好地为我所用.例如:普通人手机微信、短信交流,约3000~3500个常用汉字足够用,但是研究中国古代汉语的,约需要1.5万个汉字,作为医生除了常用汉字外,还需要在字库里储存较多专业名词或大量的药品名称等.
2.建立汉字单字或多词组应用数据分析系统
汉字与英文单词有很大不同,英语由26个字母组合成单词,而汉语是由单字与词组组合而成,而且每一个单字又可以组合成词组,这就造成汉字的新词组不断涌现.我们有必要建立汉字应用数据分析系统,对汉字或词组的使用频率、新旧词组的增减、汉字字库的容量等进行科学统计,利用统计结果对汉字的使用情况进行分类,把汉字进行数字化、科学化的整理,让汉字更好地为各行各业人群服务.
3.建立快速汉字信息搜索系统
我们在网上搜索信息时,一般需要将汉字信息全部输入,方可查寻到此类信息.如果我们建立快速汉字信息搜索系统,根据声母的排列组合的组合数容量,5个字以下利用声母与笔画相配合查找,五个字以上的,直接输入声母就可以非常快速查询到此类信息.此方法非常适合图书馆的信息检索系统.
基于数学原理的拼音笔画输入法,不仅是一门汉字输入技术,而且能使汉字体系进一步深化,为快速发展的各个领域提供更好的服务.
【关键词】拼音笔画;数学;体系构建
一、数学聚集整合技术的应用
英国著名科学家李约瑟编撰的《中国科学技术史》一书,曾这样说过:中国是最早发明水排的国家,也是最早发明风箱的民族,但却没有把它们整合起来变成蒸汽机.其原因是没有最终把两者有机整合在一起.
说起蒸汽机,首先想到瓦特,但他并不是发明者.瓦特的重大贡献就在于技术改进,且运用数学原理,经过反复实验、计算得出运行效率高于以往四倍的结果,使蒸汽机性能大大提高,从而促进了第一次工业革命的兴起.下面介绍的拼音笔画输入法,就是利用了聚集、整合技术和数学方法构建的.
二、拼音笔画输入法
我们知道汉语拼音是由声母和韵母组合而成的汉字字音,而拼音笔画输入法是利用拼音声母与汉字笔画相结合来实现的.汉语拼音总共有23个声母,汉字笔画可分为五种:横、竖、撇、捺、折,可以用键盘数字1、2、3、4、5代替.每一个汉字都是由声母与笔画组合而成,根据数学中排列组合乘法定理,可以计算出总组合数来.现将乘法定理叙述如下:
完成一件事,需要将其过程分成几个步骤,做第一步有m1种不同的方法,对于第一步的每一种方法,做第二步均有m2种不同的方法;对于前两步的每种方法,做第三步有m3种方法……以此类推,做第n步,对于前(n-1)步的每种方法,均有mn种方法,那么完成这件事共有P=m1*m2*——*mn种不同的方法.
1.汉字的单字输入法
规则:取声母232取笔画53
笔画取法:上下结构的汉字取第一、第二笔画和末笔画;左右结构的汉字取左侧的第一笔画和右侧的第一笔画及末笔画;不够三笔的汉字用空格代替.
声母与笔画总组合数为:232*53=2875种
例如:汉 h454 字 z421
需要说明,不是每一种声母与笔画的组合都可以组成一个汉字,但是每一个汉字都是由声母与笔画组成,这里的总组合数为平均数.根据国家公布《通用规范汉字表》(2013版),共收录汉字8105个左右.假设每一个声母和笔画都可以组成一个汉字,那么平均重码率8105/2875≈3个汉字.从理论上来讲基本上满足我们使用要求,不翻页或少翻页找字,极大地节约了输入汉字的时间.
2.汉字的双字词组输入法
规则:取声母组合数232 取笔画组合数52
笔画取法:取第一个字的第一笔画与第二个字的最后一笔.
双字词组总组合数为:232*52=13225
例如:科学kx32 东西dx11
根据《现代汉语词典》词汇总量约六万条,其中双字词组不超过四万条,汉字平均重码率40000/13225≈3个字,同样也节省了汉字双字词组输入的时间.
3.汉字的三字词组输入法
规则:取声母组合233 笔画输入52
笔画取法:取第一个字第一笔,最后一个字末笔画.
汉字三字词组总组合数为233*52=304175
例如:俄罗斯 els32
汉字三字词组基本上不存在重码,大多不需要翻页.
4.汉字四字词组输入法
规则:直接输入声母,笔画输入基本上不需要采用.
四个字声母组合数234=279841
例如:一针见血yzjx 一心一意yxyy
五个字及其以上的词组(容量235=6436343)只要使用声母就可以完成汉字词组的输入,不需要再输入笔画,这样输入速度更加快捷方便.
三、拼音笔画输入法特点
从以上对汉字单字及词组进行计算与分析,得出规律为:汉语拼音的声母用来输入汉字或词组,笔画用来确定矫正每一个汉字或词组.当输入四个字及其以上的词组时,根据其组合容量,基本上不需要输入笔画,这样极大地减少了敲击键盘的次数,使输入词组更加快速方便.拼音笔画输入法还有以下一些特点:
1.减少敲击键盘的平均次数
以拼音输入为例,输入一个汉字,最少敲击2次键盘 (不算重码翻页)(壹yi),最多敲击6次键盘(状zhuang),平均输入键盘3.5次。
从上表中可以看出,采用拼音笔画输入法,敲击键盘的次数明显减少.
2.解决汉字读音不准的问题
地区方言差异较大,声母不易读准的音zh、ch、sh与z、c、s;韵母不易读准的音en、eng、in、ing,这些不容易读准的声母和韵母在汉字中占有很大比例,由于读音不准确,导致在拼音输入过程中输入速度受到影响.
3.解决汉字输入过程中的重码问题
无论是使用拼音输入法还是笔画输入法都存在大量的重码,但把两种输入法结合起来,就大大地降低了重码率,节约输入时间,从而使汉字输入更加简便、快捷.
4.加深人们对汉字字型的印象
汉字是语言与字型完整结合的产物,这是汉字文化固有特点,使用这种输入法,可以加深对中国传统汉字字型的记忆印象,加强对中国汉字书写与阅读的继承与发展,具有不可替代的意义. 5.推进汉字输入法的延伸和扩展
汉字的字形结构形式比较复杂,它不仅有上下、左右结构,还有许多字形结构形式,如里外型(国)、品字型(森)、倒品型(馨)及独体字型(凸、凹)等,为了减少重码,增加几个常用字根以及相对应的数码,使输入汉字更快捷.所增加的字根及数码键盘对应如下:
键盘0:口、日、目、月、田、罒等,此类部首占汉字总量16%~20%左右.
例如:国g014 、 启q450 、曼m004 、眼 y054
键盘7:七、土、士、扌、艹等,此类部首占汉字总量10%左右;
例如:草c702 、地 d757 、把b757、北b217
键盘8:八、乄、人、丷、灬.小等,此类部首占汉字总量10%左右.
例如:放f438 、然r348 、众z888、兑d805
增加的3个数码,其拼音与笔画组合数为:23*83=11776.重码率为8000/11776≈0.68%
四、建立与时俱进的汉字输入应用体系
汉字拼音笔画输入法被大家认同需要一个过程.但它应用数学原理建立起来的数学体系非常重要.马克思说:“一门学科只有当它达到了能够成功运用数学时,才能真正发展”.数学原理的引入为我们在工作中解决实际问题提供了理论依据,它揭示了事物内在规律,化难为易,把奥妙变为常识.为此,拼音笔画输入法的应用又进一步拓展了空间.
1.建立属于自己的汉字字库系统
由于每个人使用汉字的用途及专业分类领域不同,使用汉字单字和词组的频率也不尽相同.因此,有必要组建属于自己的汉字字库系统,从字库系统中提炼出属于自己的汉字字库,再结合汉字输入过程中的联想功能和学习记忆功能等,以便更好地为我所用.例如:普通人手机微信、短信交流,约3000~3500个常用汉字足够用,但是研究中国古代汉语的,约需要1.5万个汉字,作为医生除了常用汉字外,还需要在字库里储存较多专业名词或大量的药品名称等.
2.建立汉字单字或多词组应用数据分析系统
汉字与英文单词有很大不同,英语由26个字母组合成单词,而汉语是由单字与词组组合而成,而且每一个单字又可以组合成词组,这就造成汉字的新词组不断涌现.我们有必要建立汉字应用数据分析系统,对汉字或词组的使用频率、新旧词组的增减、汉字字库的容量等进行科学统计,利用统计结果对汉字的使用情况进行分类,把汉字进行数字化、科学化的整理,让汉字更好地为各行各业人群服务.
3.建立快速汉字信息搜索系统
我们在网上搜索信息时,一般需要将汉字信息全部输入,方可查寻到此类信息.如果我们建立快速汉字信息搜索系统,根据声母的排列组合的组合数容量,5个字以下利用声母与笔画相配合查找,五个字以上的,直接输入声母就可以非常快速查询到此类信息.此方法非常适合图书馆的信息检索系统.
基于数学原理的拼音笔画输入法,不仅是一门汉字输入技术,而且能使汉字体系进一步深化,为快速发展的各个领域提供更好的服务.