语音学的研究现状和展望

来源 :汉字文化 | 被引量 : 0次 | 上传用户:skyy2483
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  19世纪后期,近代语音学从学科内部逐渐分化发展出两门分支学科:一个是后来在语言学领域中引起一场革命的音位学(60年代后统称为“音系学”);另一个就是实验语音学。20世纪20年代初这两个分支学科成为相对独立的新兴学科,各自沿着自己轨道发展到今天。
  实验语音学,简称“语音学(Phonetics)”,是一门借助医学、声学、计算机科学、心理学的知识和最先进的设备来揭示和研究语音产生的过程、语音的声学特性和人对于语声感知特性的科学。凡是依靠语音来进行交际的地方,不论是人和人,还是人和机器,都是可以找到语音学的足迹,语音学已成为语言科学中最活跃、最贴近应用的一个分支学科。上世纪50年代语言学大师罗常培先生曾明确给出了界定:“靠仪器的帮助精密分析上述两种现象(发音生理和物理现象)的,叫做实验语音学”。语音学有三个基本的分支:生理语音学、声学语音学和感知语音学。
  1.生理语音学,又称“发音语音学”,是一门研究语音怎样产生的科学。大家都知道,语音的产生依赖人类发音器官的活动。由于发音器官深藏在体内,无法直接观察它的活动,只能依赖于当前先进的医学仪器和专门设计的设备研究它的活动机理。发音器官及其研究方法大致可分为:
  1.1动力部分,即肺及其支撑呼吸的肌肉群,由它产生的气流去推动声带的振动和声腔的活动,这就是语音的空气动力学特性。现在有专门的设备研究各类音素产生时的气流、气压、声门阻抗、声效率等诸多特征。
  1.2 振动部分,即声带在气流冲击下的振动特性。声带振动是元音和浊辅音产生的必要条件,但声带是如何振动的以及振动的状态是怎样的成为研究的重点问题。依靠频闪喉镜(Stroboscopy)可以清晰地看到声带振动的状态并以此为基础提出了声带振动的“粘膜-肌弹性空气动力学说”。图一是声带振动一个周期中不同相位的真实图形,它告诉我们声带振动不仅双侧声带发生水平位移,而且又伴有上下声唇的活动。根据这一学说石坂谦三和Flanagan(1978)提出了双质量模型及其等效电路,这对医学嗓音和语音计算机技术都有重要意义。声带动作状态的研究也对语言学中元音的“松/紧” (或“阴/阳”)对立提出了科学解释。[1]这方面更全面的研究可参见孔江平[2]文。
  


  1.3 共鸣器官,主要指唇、舌的活动所形成的各种腔体(口腔、咽腔和鼻腔)形状,依靠这些器官的活动,配合声带振动,产生出众多音素,形成可懂的语流,因此发音器官动作的研究成为语音学中最为重要但又十分困难的课题。在我国,早在上世纪60年代,出版了“普通话语音图谱”[3];80年代使用动态X光技术出版了“普通话发音动作X光录像带”[4]。不久将来,一套基于X光录像带的发音器官动作轮廓线描迹光盘将正式问世,为各类普通话教学提供真实可靠的视觉材料,也为语音技术—发音器官合成提供不可或缺的数据。
  近年来,一套专为发音动作研究用的电子腭位仪(Electropalatography)已应用到普通话的研究,它可以连续记录和显示发音时舌与上腭接触的部位和接触面积的大小。借此可以获得发音部位、发音方法以及协同发音的图像和翔实数据。由图二我们可以清楚看到“当dang”的后鼻音受第二音节声母/ch-/ 舌尖部位的影响,在T1处仍表现为后鼻音,但20毫秒后马上变为前鼻音(T2处)。这种现象就是“协同发音”的有力证明。[5]
  


  1.4 唇形研究。唇形的圆展是音素变化的一个要素,元音因此分为圆唇元音和展唇元音;而辅音也因唇的圆展区分出对立的音位。在唇形研究中与音位对应的称为“视位(viseme)”。目前流行于言语工程界的视听言语处理(AVSP)结合视觉感知手段,提高了合成言语的自然度和语音识别系统的识别率。特别是在虚拟人像的生成中,唇型的变化对感知的真实性有特别重要的作用。由于其有着改善人机交流界面、提高有听力障碍的人和正常人在噪音环境中的言语理解等广阔的应用背景,视位研究正逐渐受到越来越多人的重视。[6]文采用测量13个唇形参数(见图三),应用SPSS统计分析,最后得到了普通话视位和视位变体,见表1。
  


  
  2.声学语音学
  利用声学分析的理论和方法(专门的硬件和软件)对语音信号进行分析,得到各类音素的声学特征和数据,藉此对语音音质作出科学的研究,印证或修正前人的结论,提出新的研究思路和预见。
  2.1 嗓音声学分析:声带的质量及振动的状态和方式对形成不同嗓音音色具有决定性意义,这些不同的嗓音是可以被感知的,经声学分析就可得到不同的声学特征,由此,语言学中元音紧松的差别也可以得到解释。利用得到的特征和数据,我们可以构筑嗓音的声学模型。语音学在这一点上与嗓音医学紧密地联系在一起。
  2.2 元音声学分析:元音的声学特征有一系列“共振峰(Formant)”,它是由声带振动的脉动波,经声腔的共鸣(调制)形成的。每个元音有五个彼此不同的共振峰。普通话十个元音的共振峰数据见表2。每个元音的前两个共振峰对音质起到决定性作用,我们将头两个共振峰数据定位于直角坐标系上,就得到了声学元音图,如图四 。由此我们可以对元音音质作出评价,讨论它们与舌位的关系。当前公认第一共振峰(F1)与舌位的高低相关,舌位越高,F1值越小;第二共振峰(F2)与舌位前后相关,舌位越前,F2值越小。
  


  2.3 辅音声学分析:辅音的产生,特别是清辅音的产生与元音有完全不同的机理。它们的激励源不是脉动波,而是声门气流通过声道狭窄产生的湍流或克服声道中的障碍产生“破裂”脉冲。由于构成障碍的部位和克服障碍的方法不同,因此形成了众多的辅音音素。由于辅音产生的机理不同于元音,因而辅音的声学特征也不同于元音。目前通用的辅音声学特征是:
  GAP塞音无声段,它标志塞音成、持阻的时间。词首(或句首)位置的塞音量不到GAP,变通办法是用同部位的GAP均值来充垫;
  VOT 嗓音起始时间,指声带振动相对于塞音破裂的时间;
  CD 辅音时长,在一般情况下CD=GAP+VOT,但在浊塞擦音中,CD应是-VOT与+VOT之和;
  CA 辅音强度(dB);
  Tof 元音过渡段起始点频率,它是由塞音成组部位决定的;
  CFAi清擦音强频区,或称为清擦音共振峰,一般需测量4-5个强频区位置;
  VFi 浊擦音共振峰,鼻音、边音等归入此类。
  其他特征还有测量擦音的“重心”(Center of Gravity)和“分散”(Dispersion)和测量塞音的“音轨方程”等,详见[7]文。总之,由于辅音的发音部位、发音方法以及在语流中彼此组合的多样性,造成了辅音声学特征多样性和复杂性以及测量的难度。所以,辅音的测量应在辅音产生的声学理论指导下,不宜仓促上阵,草率从事。
  对语音进行声学研究有两种策略,一种是对某类音素进行单语种或多语种的分析;另一种是对某种语言或方言的语音系统进行完整的分析[8]。后者比较复杂些,但意义重大。比较典型的工作是中国社科院民族研究所语音研究室坚持了10来年所建立的《中国少数民族语言语音声学参数数据库》,这个库已集成了蒙古语、藏语、维语、哈萨克语、彝语、鄂温克语、鄂伦春语和达斡尔语。[9]
  2.4 声调与语调
  2.4.1 声调:在一种语言中,音高(F0)随时间的变化模式具有词汇意义时,这种音高模式就是声调。音高是指声带每秒钟振动的次数,又叫做“基频”(fundamental frequency,F0)。声带振动频率越高音调就越高;振动频率越低音调就越低。声带振动快慢受控于声门下压力(Ps)的大小和相关喉肌(环甲肌、甲杓肌等)的收缩力的强度;汉语是声调语言,因此研究声调和变调受到极大重视。当前的语音数字信号分析硬件与软件对音高测量的准确率较高,使用也很方便。图五中给出了普通话四个声调的音高曲线,它又能以数值的格式表达和贮存。
  


  
  2.4.2 语调:广义地说,一种语言或方言的语调,在感知上是语音的轻重缓急和抑扬顿挫的腔调;在声学上实现为音高、重音、轻声、节奏协调变化的综合效应,主要表现为语句音高变化的总体模式;在功能上主要表达语气、情感,同时也有一定的语义表达作用。狭义地说,语调就是语句的音调模式,也就是语句音高变化的总体轮廓,通常采用音阶运动的走势来描写。我们汉语既有声调又有语调,两者又都表现为音高的形式,它们之间是一种什么关系?又如何区分它们?赵元任先生提出了著名的字调与语调是“代数和”关系,他用“大波浪”(语调)和“小波浪”(声调)的比喻来说明这个问题。当前为了提高语音合成的质量,语调在国内外均得到了广泛而深入的研究,提出了各种理论与方法。[10]图六列出了普通话与粤语同一句问话的语调分析。
  


  
  3. 感知语音学
  感知语音学又称心理语音学,具体研究语音在大脑和听觉器官中的编、解码“秘密”。当需要说话时,一般的过程是:准备概念—论题接入—音系编码—语音编码—发音。而其中每一步都有自己特定过程和内容。现在一般采用记录脑电ERP(事件相关电位)和利用功能性核磁共振技术(fMRI)观察大脑皮层的定位反应。
  在语音学中,通过刺激—反应方法,已确定元音属于连续感知,塞音的部位属于范畴感知。而声调也属范畴感知。
  当然,对大脑认知的研究是十分困难的,要真正弄明白“人是怎样说话的”和“人是怎样听懂说话的”这样的命题,还需要走很长的路。
  以上介绍了语音学研究的基本内容,由此可以看到语音学本身是一门介于自然科学与社会科学的边缘科学,它的研究成果不仅极大地促进了语音系统的科学性,而且对各类语言教学提供了新的理论和方法。语音学另一重要贡献是促进了语音技术(语音合成、语音识别、语音翻译、语音转换和语音教学自动测评)的发展。目前,语音学也介入到刑侦科学中,语音分析的结论可以作为法庭的证据。可以预期,语音学的发展必将为社会进步作出更大贡献。
  
  参考文献
  [1] 孔江平《论语言发声》,中央民族大学出版社,2001
  [2] Kong Jiangping Laryngeal Dynamics and Physiological Models-High Speed Imaging and Acoustical Techniques,Peking University Press,2007
  [3] 周殿福、吴宗济《普通话语音发音图谱》,商务印书馆,2003
   [4] 鲍怀翘、杨力立《普通话发音器官动作特性》(X光录像带),北京语言学院出版社,1985
  [5] 郑玉玲、鲍怀翘《论普通话/-N1C2/的协同发音》,载《现代语音学与音系学研究》38-45页,天津社会科学出版社,2004
  [6] Wang Anhong ,Bao Huaiqiao,and Chen Jiayou,Primary research on viseme system ofStandard Chinese,ISCSLP2000,171~174. Oct. 13-14,Beijing,2000
  [7] 鲍怀翘《辅音声学特征简议》,载《中国语音学报》第一辑83-89页,商务印书馆,2006
  [8] 呼和《蒙古语语音实验研究》,《中国蒙古学文库》,辽宁民族出版社,2009
  [9] 鲍怀翘《〈中国民族语言语音声学参数数据库〉简介》,第16届国际民族学与人类学联合会会议录,中国昆明,2009
  [10] XU Yi,Separation of Functional Components of Tone and Intonation from Observed F0 Patterns,in From Traditional Phonology to Modern Speech Processing.pp.483-506.edited by G.Fant,H.Fujisaki,J.Cao and Y.Xu. Foreign LanguageTeaching and Research Press,2004
  
  (通讯地址:100081中国社会科学院民族学与人类学研究所,作者为研究员)
  
   语言文字大论坛网址:http://www.writingforum.cn
其他文献
咸阳市位于关中八百里秦川腹地,辖三区十一县,东临铜川,南依西安,西与宝鸡接壤,北与甘肃相连。总面积10213平方公里,市区建成面积30平方公里。总人口445.34 Xianyang City
第二届中俄双边新材料新工艺研讨会将于1993年10月13—17日在古城西安召开,会议由西北有色金属研究院承办。组委会共收到250余篇论文,主题范围包括结构材料、功能材料、新工
德日进(Pierre Teilhard de Chardin,1881~1955)是法国古生物学家、地质学家,天主教神甫。由于反对教义思想,1923年被“发配”到天津的法国天主教堂。来华后,先在天津北疆博
俄罗斯食品价格几个月上涨几十倍,千百万人的生活落到贫困线以下。与去年相比,人们消费的奶制品差不多减少1/4,肉制品减少15%,鱼制品减少10%。脂肪在食品总构成中的比重接近
1992年以来,随着小平同志南巡和社会主义经济改革的进一步加快,我国经济建设进入了一个新的高速发展阶段:初步测算,全年国内生产总值23400亿元,按可比价格计算,比去年增长12%
机床在使用的过程中,由于铁屑嵌入,润滑不良等原因,造成导轨面的划伤或大面积研伤。研伤后如不及时修复,则研伤面会很快扩展。采用刮削或磨削方法修复导轨费时、费力。下面介
金属物理立方系完整ODF侧算的改进·”·”·“·“·“·“一””““““····”·“·”·“·“·..·”·一赵宏王福徐家祯梁志德(卜A 11)Ni3AI的成健特征·····
一我一九二九年夏天,是和同乡谢兆华、刘丕承一道去上海的。虽然在政治、思想上一向就存在显著差距,但是自小相识,特别同谢,刚才发蒙,就在一道读书了,而且他父亲谢象仪和我
本文提出了一种新的加工精度控制方法——自适应预报控制方法。该方法通过对加工过程的在线、实时辨识和预报,不断获得加工过程的当前状态和未来状态的信息并根据这些信息作
一、对下半年宏观经济形势的政策摸拟下半年国民经济的走势如何,是管理部门和企业十分关心的问题,由于7月份6号文件出台了多 First, the macroeconomic situation in the s