语音音素的循环结构

来源 :科技创新导报 | 被引量 : 0次 | 上传用户:hljxkbsyly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:一个汉字就是一个字节。字节由1个音素或最多4个音素组成。由于每个音素的发音方法和发音部位不同,又分为元音和辅音两大类。每个音素的发音具有区别于其它音素发音的独立特征,称为特征音。除部分辅音外,音素是以被泛音调制后的基频周期为循环周期的波动。由于泛音的调制作用,相邻波形极性对偶但半周期却不对称。
  关键词:特征元群周期
  中图分类号:H311 文献标识码:A 文章编号:1674-098X(2011)08(b)-0224-02
  
  为了展示音素的循环结构,对于语音放大采用高增益放大器,放大器频带宽度设定在150Hz~2kHz。将语音中凡过零点的波动均被放大至脉冲状,没有过零点的波形被摒弃,经整形后送入计时器,记录每一个半波宽度(即半周期),并存入存储器。再播放时尽管有些失真,但仍然保持了原语音的基本特征。
  记录半波半周期的计时器为16位宽。一个半周期数据必需用两个8位寄存器分别存储低字节和高字节。在文中标注时,采用双字节标注法有利于数值间的比较,其标注方法是:低字节数据在前,并有下划线;高字节数据在后,字体略大,与低字节数据之间不留空格,表示为一个完整的半周期数据;与前后相邻半周期数据画出高低电平以示区别。如表示1289这个半周期数据处于高电平,相邻半周期数据为低电平。计时器在运行时,每1微秒作一次加1操作,1289这个以双字节标注法表示的半周期数据转换成以秒为单位的10进制数为(9×256+128)×0.000001(s)=0.002432(s)。例1是单音素、阴平调“衣”的语音记录片段。
  由于人的发声器官不可能对每个半波半周期都控制的非常精确,在允许一定误差的前提下,可以看出在例1中存在一个循環单元贯穿其中,由有下划线和不划线来区分(有无划线只是为了区分,没有本质区别);在这里称这个循环单元为特征元。在例1中所有特征元均为4位组成。相邻特征元的同一顺序号的位为对应位;如果对应位之间正负差值在几微秒~百微秒左右之间(个别现象除外)即认为是相同的。由于是循环结构,特征元的划分从任一位为起始位都是一样的;为了明显一致,特征元的划分以较低频率、高电平半波为起始位。
  除部分辅音如X、SH、S等,是由声带送气、声源在嘴部发声以外,凡以声带发声为声源的音素都具有循环结构。如果出现特征元发生变异或消失必定是当前音素发音的结束。特征元内最少由一高一低两位半波组成,最多可达几十位。语音放大器带宽越宽位数就越多,反之减少。在相同条件下,不同特征音其特征元位数也可能不同;但是无论位数多少,必定由偶数位组成。
  不同的特征音在特征元内有着不同的半波组成。例2是从不同的特征音中提取出来的特征元。通过比较可以看出它们之间的差别。
  选择一个单音素、阴平调语音音素发音序列,将其划分出特征元,在保证特征元完整不变的前提下,把顺序打乱,以特征元为单位随机输入存储器,在播放时仍发原音。如果随机输入时每个特征元从尾部向前输入,也就是特征元反向输入,再播放时特征音仍不变。如果将所有特征元拆分开来,再随机输入,那么特征音便不复存在了。这说明特征元是保持音素特征音的最小单位。
  特征元内各位半波半周期的总和称为群周期,以TN表示,对TN数值的表示方法仍采用双字节标注法。群周期由式1/TN﹝将双字节标注法转换为(秒)﹞=频率,进行群周期与基频频率的转换。
  音素中特征元群周期不是一成不变的。在阴平调语音中会有小幅变化,在阳平、上声、去声的语音中,群周期随着声调的改变而改变,声调越高群周期越短。男声群周期长,女声群周期短。所以也可以同时认为音素是以特征元群周期为循环周期的。
  例3中第一、二行是分别从校音管“A”和88键钢琴小字一组音名为“A”的发音序列中提取出的特征元。理论上它们的波动频率(440HZ)应该是相同的。再把二胡的外弦按校音管“A”校准,将其发音序列中提取出的特征元列于第三行。
  在例3中,泛音按自身规律调制基频,于是就产生了独有的特征音(在音乐中叫音色)。同一基频被不同的泛音调制就会产生不同的音色。这就触类旁通的证明了语音中不同的特征音其特征元为什么会有不同的内部组成。
  通过分析,可以得出:群周期与基频的波动周期是相同的。但是群周期与基频周期是两个不同的概念。群周期更加明确的揭示出音素的内在原理。
  单音素字节的发音就是单音素本身的发音。由2~4个音素组成的字节中,人的发声器官对每个音素按即定顺序逐个发音(参照汉语拼音),人耳听觉系统听到的是这些音素的组合音。
  在说话时,每个字节中音素的群周期,是随着地方方言发声规律、声调变化、再结合个人习惯、情感表达的不同而变化的。而在唱歌时,歌声中每个字节中音素群周期(除部分辅音外)必须与伴奏器乐对应音高的波动周期相同或呈倍频程(octave)关系,由于字节中音素的群周期依照音高按12平均律的规则变化,于是语音就有了乐感。
  但是在歌声中音素群周期与音高对应不是跳变的。字节与字节之间的音高改变和一个字节在延长发声过程中的音高改变均不是跳变的。在两个不同音高的中间一小段过渡部分,群周期具有趋向性滑动改变:后音高高于前音高的群周期会递减直至达到目的音高;后音高低于前音高的则相反。
  当声调变高时,群周期在循环过程中逐渐变短,特征元内各个半波的半周期有的位减值大,有的位减值小,也有的位保持相对稳定,这种变化并非变异,所以仍然保持着特征音。例4是从上声调“五”的语音序列中声调从低到高的一段提取出来的特征元进行比较。为了比较的方便,在例4中将特征元竖向排列,在实际语音中它们是首尾相连的。
  在例4中每个特征元前面的数字为排队号,后面的TN值为群周期。第1号特征元内为6位,当运行到第7号时,第2位数据已减值到几乎为原值的一半,第3位数据也有减值。从第12号运行到第13号时,第1、2、3位数据已消失。第13号特征元的第1位数据是在这之前第1、2、3位数据的合并。特征元从第13号开始变为4位。从第13号到26号中的第1位继续不断减值,从第26号直到发生变异之前一直保持着这种组成。
  如果将第13号以前特征元的第1、2、3位数据作人为合并(例4括号内数据),不会影响特征音,只是清晰度有所下降。所以可以将前3位看成是1个数据,这样一来所有的特征元都为4位。从中可以看出随着声调的升高,特征元内的第1位在不断减值,造成群周期的连续减小;但对所有特征元的后3位影响却相对较小。
  在语音中存在很低频率的半波被分解现象,这是因为声带作很低频率振动时,由于半周期过长,在极限位置不能持久,便物极必反的向反方向运动(也应该属于泛音,如果将语音放大器频带放宽,会出现更多分解)。从波形上看就是被分解。随着声调变高群周期缩短,这种现象就会消失,形成合并。这就是例4中1~12号特征元的前3位数据半途合并的原因。合并后的这1位继续减值,当与其它同极性位的半周期数值接近时,语音就进入尾声了。
  相邻特征元的群周期存在正负差值,而且特征元之间对应位也存在正负差值。语音中的差值激励人耳听力、增添了活跃气氛,但是这两种差值过大会造成语音噪声加大;如在语音启动阶段位与位之间差值较大(百微秒以上),噪声也大。随着差值的逐渐减小,语音变的清晰起来。如果完全消除差值,就会毫无生气,失去“生命迹象”,变成类似于共鸣的振动感。
  不同的泛音结构对基频的调制会产生不同的特征音。泛音占据的是基频的份额,在满足了所有泛音的占据以后,在基频中只剩下相对泛音要低很多的低频半波了(有可能被分解)。群周期的变化首当其冲是相对低频半波的变化,每个泛音半波在变化中保持了相对稳定。这就是特征元的内涵。
  在语音中任何一个有潜在能力可以影响語音性质的因素,如果仅在个别地方出现,其影响力微乎其微;它必需具有极高的重复概率和连续性才能发挥作用。
  结论:
  一.以声带发声为声源的音素中存在一个循环单元称之为特征元,特征元是语音中的基频被泛音调制以后的组合体,由偶数位组成,是保持音素特征音的最小单位。不同音素的特征元具有不同的内部组成。语音的传送以基频为载体,以泛音的调制为特征。
  二.特征元内各个位半波半周期的总和称为群周期,语音声调由群周期决定。群周期与语音基频的波动周期是相同的。
  三.歌声是具有循环结构的音素群周期按12平均律规则变化的語音。
其他文献
2006年4月11~12日,山西省出现了历史上罕见的暴雪天气。通过对此次暴雪天气的大尺度环流形势场和主要影响系统进行分析,并对水汽条件、动力条件等物理量特征进行剖析,从而了解和
以轴流压缩机动叶片为研究对象,利用ANSYS软件研究了在3种不同工作载荷情况下叶片的静态特性,得到其应力与变形的分布规律。研究结果表明:叶片的高应力主要由离心力引起,高应力区
一、用真诚的爱打动学生爱是人的一种基本需要,是学生的一种心理寄托,是学生一种内心渴望。教师只要真诚真心付出爱,不但可以让学生体会到温暖之情,而且还很容易打动学生。一旦学
作为地基加固处理的一种方式,托换技术在土木工程建设中具有举足重轻的作用。本文主要介绍桩式托换、灌浆加固托换以及基础加深加宽托换的托换机制及其适用范围,旨在表明托换
沥青路面修筑过程中应因地制宜。更应从实际出发利用沥青表面处治、沥青灌入式等简便、省钱的施工方法来建设沥青路面。结合工作实践,论述了在城市道路施工过程中沥青表面处
2010年5月11日,《中国城市发展报告(2009)卷》(以下简称《报告》)在京发布。《报告》指出,中国目前已经进入城镇化快速增长时期,城镇化水平从2005年的42.99%提高到2009年的46.59%
提出了一种称为蚁群优化算法(ACO)的自然启发式(metaheuristic)技术,以便为多功能水库系统制定合理调度策略。大多数实际问题的解决方案往往涉及非线性优化,附带高维数和大量等式
【摘要】所谓成就动机主要是一种追求成功、竞争的习得性动机。成就动机是一种潜在的人格特质,它是一个人将自己的活动保持在尽可能高的水平上与不断增加的努力之中,将活动的成绩推到最好的心理倾向。我国城乡结合部生源比较复杂,特定的生活环境导致很多小学生在学习习惯、行为习惯、综合素质等方面同城区的学生存在着较大的差距。本文将就城乡结合部小学生成就动机的激励机制构建进行探讨,以期为促进城乡结合部学生成绩的提升奠
【摘要】为了提高作文教学效率,作文教学可以将原有教学模式完全打破,把作文教学的内容、时间、形式、批改和讲评变活。  【关键词】作文教学 内容变活 时间和形式变活 批改和讲评变活  【中图分类号】G623.24【文献标识码】A 【文章编号】2095-3089(2016)23-0170-01  在小学语文教学中,作文教学既是重点,也是难点。学生的一篇习作不仅能体现学生驾驭语言文字的能力,而且能体现出学
【摘要】 在这高速发展的时代,教师与学生的课堂互动问题愈发重要,而影响课堂互动的关键在于心理效应。在本篇文章中笔者梳理出了影响课堂互动的三种心理效应,一是教师在学生心目中的第一印象;二是师生关系;第三点也是最重要的一点是教师的教学风格。并就这三种心理效应一一作出促进课堂互动的相关建议,由此得出结论:教师要做到树立良好形象,保持良好的师生关系,并兼顾风趣幽默的风格和严谨的态度着三点,才能促进课堂互动