论文部分内容阅读
摘 要:近代以来全世界大多数语言在文字上都推行了拉丁化,在此过程中很多语言遇到了诸多问题,其中最明显的一个问题就是文字的线性化。特别是对于声调语言来说,如何使文字在表现声调的基础上进行线性化是一个棘手的问题。本文针对于该问题,以粤语为例,采用音节之中同一音素不同书写及组合出现等方法,对声调语言进行无损伤线性化处理。
关键词:线性化;声调;同位书写;组合出现
中图分类号:H201 文献标识码:A
文章编号:1009-0118(2012)07-0280-03
一、引言
近代以来由于种种原因,很多原本采用非拉丁字母书写的语言纷纷改用拉丁字母书写,例如越南语,马来语,壮语,苗语等。在拉丁化的过程中,为了书写清晰美观,打印和信息处理的方便,一般来说都会遵循线性化这一原则,即在书写的过程中尽可能地只用26个拉丁字母书写,尽可能少地使用调号,辅助符号等。但是进行拉丁化的语言中有很多是是声调语言,在这些语言中声调是用来区分语义的。例如汉语,同样是yi,声调不一样就会有不一样的意思:衣,移,以,意,其他声调语言有类似的情况。那么如何在线性化的过程中将声调也明了地表现出来就成了一个问题。
对这个问题有很多学者已经提出了不少宝贵的方法,其中最为典型的一种就是将一些特殊的字母,包括在很多情况下不发音的字母以及在该语言中用不上的字母来进行标调,例如:壮文中的“j”“q”“x”“z”。这种方法虽然简单易行,但是看起来很奇怪,奇怪之处在于国际上大多常用的语言很少有将字母用来标调的,例如英语,法语,德语,西班牙语等。因此,类似的文字很难给人一种国际认同感。并且用这些方法所标的声调数量也是非常有限的,因为在用26个拉丁字母表现一种语言时,鲜有有大量字母在书写音节时是用不上的,如汉语拼音方案中只有V这个字母是没有被使用的。
二、同位书写组合出现法
鉴于以上论述,本文提出了一套新的拉丁线性化技术,适用于声调语言,特别是声调数目较多的语言。不同于以往的线性化技术,该技术采用同位书写组合出现法标调。
所谓同位书写,就是同一个音位用不同的字母或字母组合进行书写。例如英语里的/i:/可以写成可以ee,如see也可以写成ea,如sea.那么ee和ea就是同位书写了。同位书写的字母或字母组合不得少于两个。另外,同位书写不仅局限于元音,还可以用于辅音,例如英语里的/f/可以写成f,如food,也可以写成ph,如photo.对于同位书写的不同字母或字母组合,可以人为地定义名字,比如“阴书”,“阳书”。例如我们可以规定在英语中对于/f/这个音素,f是阴书,ph是阳书,当然这个规定对英语来说是没有多大意义的。对于多于两个的同位书写字母或字母组合我们可以给出更多的名称,比如:“阴书”“阳书”“中书”“阴阳书”等等。
所谓组合性出现,是指一个音节中几个因素以各自不同的书写方式进行排列组合式地组合出现,以达到表调的效果。比如在用汉语拼音书写“山西”和“陕西”的时候,人们往往会把前者写成Shanxi,后者写成Shaanxi加以区分。这个例子用在同位书写组合出现法中也是可行的。普通话音节构成是CVC,即一个辅音(consonant),一个元音(vowel),最后的一个辅音是由/n///其中一个构成的,其实当没有这两个辅音韵尾时,我们也可以将其看做是空辅音韵尾。普通话有四个声调,那么就需要有四种不同的音节表现形式。为了方便,我们可以只需采用后两个因素VC进行各自阴书和阳书的不同排列组合来实现四个不同的声调,例如可以规定/a/这个音的阴书是a,阳书是aa,/n/的阴书是n,阳书是nh;继续规定这两个因素以阴书和阴书组合时表第一声,以阴阳组合出现时表第二声,以阳阴组合出现时表第三声,以阳阳组合出现时表第四声。那么据此Shan读第一声对应的汉字可以是“山”;Shanh读第二声,无对应的汉字;而Shaan读第三声,对应的汉字可以是“陕”;Shaanh读第四声,对应的汉字可以是“善”。
关键词:线性化;声调;同位书写;组合出现
中图分类号:H201 文献标识码:A
文章编号:1009-0118(2012)07-0280-03
一、引言
近代以来由于种种原因,很多原本采用非拉丁字母书写的语言纷纷改用拉丁字母书写,例如越南语,马来语,壮语,苗语等。在拉丁化的过程中,为了书写清晰美观,打印和信息处理的方便,一般来说都会遵循线性化这一原则,即在书写的过程中尽可能地只用26个拉丁字母书写,尽可能少地使用调号,辅助符号等。但是进行拉丁化的语言中有很多是是声调语言,在这些语言中声调是用来区分语义的。例如汉语,同样是yi,声调不一样就会有不一样的意思:衣,移,以,意,其他声调语言有类似的情况。那么如何在线性化的过程中将声调也明了地表现出来就成了一个问题。
对这个问题有很多学者已经提出了不少宝贵的方法,其中最为典型的一种就是将一些特殊的字母,包括在很多情况下不发音的字母以及在该语言中用不上的字母来进行标调,例如:壮文中的“j”“q”“x”“z”。这种方法虽然简单易行,但是看起来很奇怪,奇怪之处在于国际上大多常用的语言很少有将字母用来标调的,例如英语,法语,德语,西班牙语等。因此,类似的文字很难给人一种国际认同感。并且用这些方法所标的声调数量也是非常有限的,因为在用26个拉丁字母表现一种语言时,鲜有有大量字母在书写音节时是用不上的,如汉语拼音方案中只有V这个字母是没有被使用的。
二、同位书写组合出现法
鉴于以上论述,本文提出了一套新的拉丁线性化技术,适用于声调语言,特别是声调数目较多的语言。不同于以往的线性化技术,该技术采用同位书写组合出现法标调。
所谓同位书写,就是同一个音位用不同的字母或字母组合进行书写。例如英语里的/i:/可以写成可以ee,如see也可以写成ea,如sea.那么ee和ea就是同位书写了。同位书写的字母或字母组合不得少于两个。另外,同位书写不仅局限于元音,还可以用于辅音,例如英语里的/f/可以写成f,如food,也可以写成ph,如photo.对于同位书写的不同字母或字母组合,可以人为地定义名字,比如“阴书”,“阳书”。例如我们可以规定在英语中对于/f/这个音素,f是阴书,ph是阳书,当然这个规定对英语来说是没有多大意义的。对于多于两个的同位书写字母或字母组合我们可以给出更多的名称,比如:“阴书”“阳书”“中书”“阴阳书”等等。
所谓组合性出现,是指一个音节中几个因素以各自不同的书写方式进行排列组合式地组合出现,以达到表调的效果。比如在用汉语拼音书写“山西”和“陕西”的时候,人们往往会把前者写成Shanxi,后者写成Shaanxi加以区分。这个例子用在同位书写组合出现法中也是可行的。普通话音节构成是CVC,即一个辅音(consonant),一个元音(vowel),最后的一个辅音是由/n///其中一个构成的,其实当没有这两个辅音韵尾时,我们也可以将其看做是空辅音韵尾。普通话有四个声调,那么就需要有四种不同的音节表现形式。为了方便,我们可以只需采用后两个因素VC进行各自阴书和阳书的不同排列组合来实现四个不同的声调,例如可以规定/a/这个音的阴书是a,阳书是aa,/n/的阴书是n,阳书是nh;继续规定这两个因素以阴书和阴书组合时表第一声,以阴阳组合出现时表第二声,以阳阴组合出现时表第三声,以阳阳组合出现时表第四声。那么据此Shan读第一声对应的汉字可以是“山”;Shanh读第二声,无对应的汉字;而Shaan读第三声,对应的汉字可以是“陕”;Shaanh读第四声,对应的汉字可以是“善”。