论文部分内容阅读
计算机技术将人类社会带入了信息时代。信息时代的语言学要求充分运用计算机技术推动学科的发展。计算机辅助汉语方言研究极大地推动了该学科的发展。以下我们将对计算机技术在汉语方言研究中的应用作简要述评。
一、汉语方言资料的数字化
方言资料的数字化是将方言资料转化为计算机能够处理的数据的过程,主要包括以下两个方面:
(一)国际音标的数字化。国际音标研究存在着译名规范化、编码标准化、字形统一化等理论问题。随着国际音标研究的逐步深入和计算机编码标准的不断完善,不少研究机构研制了适合汉语方言研究使用的Unicode编码的国际音标字体,并开发出便捷的国际音标输入法。其中使用较广泛的有IpaPanNew字体和云龙国际音标输入法①。华中科技大学、南开大学、南昌大学等单位也有相关的研究成果。但有些国际音标没有Unicode码位,个别音标的字形标准也存在一定的争议,这些问题都需要进一步的探讨。
(二)汉字的数字化。汉语方言研究离不开中国古代小学著作及相关古文献,涉及到一些不常用汉字显示、输入和处理问题。随着汉字信息处理技术的发展,一系列汉字字符集标准和大字符集字库相继发布,在此基础上开发的四角号码、五笔字型、手写输入等多种超大字符集输入法较好地解决了汉字的数字化问题②。
除了充分利用上述成果外,方言工作者还应对数字化资料的格式、标准等问题形成操作性、兼容性强的规范,这将极大有利于学术成果的交流与共享。目前在这方面还鲜见相关的研究成果。
二、汉语方言数据库
汉语方言数据库是利用数据库技术整合各种数字化方言资料的数据集合,能进行查询、排比、比较、计算等复杂工作。方言数据库多采用Foxpro、Access等关系型数据库建库,可分为不同的类型:从整合的资料来看,可以分为语音数据库、词汇数据库、声学参数数据库等;从研究用途来看,可分以综合数据库和特定数据库;从涉及的方言数量来看,可分为大型数据库和中小型数据库。学者可以根据自己的研究目的建立不同类型的方言数据库。以下是几种有代表性的方言数据库:
(一)DOC(汉语方言计算机字典)。DOC是汉语方言数据库建设的早期成果,它整合了《汉语方音字汇》中17个方言点的读音资料③,在此基础上开展的“词汇扩散论”、方言关系等研究取得了丰硕的成果。
(二)“汉藏语同源词数据库检索系统”。收集12个汉语方言点数据。该数据库将语言的语言信息、结构属性、描述属性等整合在一起,信息量极大④。
(三)“汉语方言声调数据库”。将已发表的汉语方言文献中的声调资料制作成数据库,可对调类、调值、调型、连调和变调等进行查询⑤。
(四)潘悟云在其开发的“汉语方言计算机处理系统”的基础上制作了方言语音和词汇数据库,并在东方语言学网上开放了部分查询服务。
从方言数据库发展的现状看,语音数据库发展最早、成果最多,理论和技术已比较成熟,但在数据库字段及数据结构设计等问题上需要进一步优化和规范;方言词汇和语法数据库仍处于起步阶段,日益受到语言学家的重视,如麦耘主持的“汉语方言词汇数据库”、刘丹青主持的“方言语法语料库”等,须加强此类方言数据库的理论和技术研究。此外,不少语言学家制作了方言音档,并将其与方言数据库整合起来,如侯精一主持的“现代汉语方言音库”,刘俐李主持的“汉语方言语音词汇库”等,这也是方言数据库发展的一个趋势。
三、方言自动处理软件
方言自动处理软件是计算机辅助方言研究的一项重要内容,它能使方言学者从繁复的整理工作中解脱出来,将精力放在分析和解决问题上。方言自动处理软件多以处理方言语音为主,它利用汉语方言之间及方言与中古音的对应规律编制计算机程序,实现研究工作的自动化,提高研究的准确度,拓展研究的广度和深度。方言自动处理软件应具有方言音系整理,方言音韵比较,机助建库和相关图表输出等主要功能。
常见的汉语方言自动处理软件有如下几种:吴道勤主持研制的“方言微机处理系统”及其后续版本“方言音系整理系统”⑥,广西师范大学刘村汉利基于EXCEL开发的“方言字音处理系统”、复旦大学中文系开发的“汉语方言研究助手”等。这些软件基本实现了预定的功能,但界面的友好性,操作的便捷性都存在一些问题,而且难以胜任大规模的方言比较研究。上海师范大学潘悟云教授基于Visual Foxpro开发“汉语方言计算机处理系统”较好地克服了上述问题,代表了此类软件的最高水平。
目前,汉语方言处理软件已经能够基本满足方言整理工作的需要,但在通用性、简便性上仍需进一步改善,使更多的方言学者能够顺利应用相关成果。
四、计算机技术与方言实验语音研究
随着计算机技术的发展,先进的电子实验仪器不断涌现,给方言实验语音研究的普及和发展创造了有利的条件。
(一)方言语音声学研究。传统的语音声学研究多使用语图仪,而随着数字化的语音分析软件的出现,在个人电脑上就可以开展语音实验研究。现在较常用的语音分析软件有KAY公司的CSL系列软件,南开大学开发的“桌上语音工作室”,荷兰语音学家开发的PRAAT软件以及美国暑期语言学院制作的SA软件等。利用这些软件,学者在方言语音特别是声调、元音的研究上取得了丰硕的成果。
(二)方言语音生理实验。方言语音生理研究是对方言语音发声、调音器官具体性质的研究,对方言语音的特性和一些疑难问题的解决具有重要的价值。实验使用的电子设备主要有鼻流计、动态腭位(EPG)、电磁发音仪(EMA)等。这些设备较为昂贵,使用范围不广,取得的成果主要集中于对上海、宁波等地方言的研究。
五、计算机技术与汉语方言地图绘制
汉语方言地理学是汉语方言研究的重要部门,而方言地图则是汉语方言地理学的必要内容。传统汉语方言地图的绘制存在周期长,成本高,不利于推广等缺点,计算机技术使方言地图的绘制更为便捷、功能更强大。
(一)图像处理软件在绘制方言地图中的运用。主要是利用Window画图工具、Coraldraw、Photoshop等图像处理软件对方言地图进行绘制、处理和修改。
(二)方言地图绘制软件的开发和应用。20世纪80年代就有学者在DOS系统下开展这项研究⑦,现在较常用的方言地图软件有“汉语方言计算机处理系统”中附带的方言地图软件,日本学者福嶋秩子开发的SEAL软件等。自行开发的方言地图软件功能少、绘图信息量不大,但操作较为简便,适于在一般学者中推广。
(三)利用MapInfo和Arcview等地理信息系统开发方言地理信息系统。方言地理信息系统突破传统方言地图的形式,功能强大,成为未来方言地图的发展方向。
六、计算机辅助汉语方言教学
汉语方言教学包括国际音标的教学,听音记音训练以及田野调查练习。传统汉语方言教学多为口耳相授,随着计算机多媒体技术的发展,计算机辅助汉语方言教学逐步开始普及。
中国社会科学出版社出版的《音路历程》光盘中有赵元任和周殿福的国际音标发音,但国际音标录音不太全;瞿霭堂、劲松制作了汉语方言教学软件,不仅有完备的国际音标发音和唇型资料,还有上海话方言调查的练习程序;此外还有一些单位制作了国际音标学习软件或多媒体教程。
现有的计算机辅助汉语方言教学软件解决了方言教学中的几个难点问题,得到广泛的应用。但存在互动性较差、学习中缺乏相应的指导等缺点,使得教学效果欠理想。有必要在教学软件中实现自动判断发音准确度的功能,并加强训练及互动的环节。
七、结语
目前,计算机技术辅助汉语方言研究的发展方兴未艾。我们认为需要在以下几方面引起足够的重视:
(一)计算机技术与汉语方言研究的结合不是简单的技术问题,同样也是涉及到了研究理论、方法等诸多问题。在引入计算机技术的同时,也需要对相关问题的属性、特点、方法等问题进行深入研究。
(二)方言数字化、方言数据库和方言处理软件的建设亟需统筹规划、制定和完善相应的规范和标准,避免重复劳动和学术资源的浪费。在相关意见尚未统一之前,有必要采取一些过渡性的措施。
(三)计算机技术是汉语方言研究重要的工具,但它不能替代研究者的创造性思维。所以必须正确处理技术与学术的关系,使计算机技术更好地为方言研究服务。
基金项目:华中科技大学优秀博士学位论文基金资助项目(D0647)
注释:
①李龙,潘悟云.国际音标输入法及其实现[J].语言研究,2006,(3):67-70.
②尉迟治平,汤勤.论中文字符集、字库及输入法的研制[J].2006,(3):63-66.
③陆致极.汉语方言数量研究探索[M].北京:语文出版社,1992:12-14.
④江荻.汉藏语数据库检索软件研制报告[A].汉藏语同源研究(三)[M].南宁:广西民族出版社,2004:401-485.
⑤蒋平.“汉语方言声调资料库”的设计及其理论基础[J].方言.1999,(3):187-196.
⑥吴道勤.方言音系自动整理系统“FYCL系统”[J].湘潭大学学报社科版.1990,(4):112-115.
⑦熊正辉.电子计算机绘制方言地图的实验[A].庆祝吕叔湘先生从事语言教学与研究六十年论文集[M].北京:语文出版社,1985:138-141.
(周 杨 ,华中科技大学中文系)
一、汉语方言资料的数字化
方言资料的数字化是将方言资料转化为计算机能够处理的数据的过程,主要包括以下两个方面:
(一)国际音标的数字化。国际音标研究存在着译名规范化、编码标准化、字形统一化等理论问题。随着国际音标研究的逐步深入和计算机编码标准的不断完善,不少研究机构研制了适合汉语方言研究使用的Unicode编码的国际音标字体,并开发出便捷的国际音标输入法。其中使用较广泛的有IpaPanNew字体和云龙国际音标输入法①。华中科技大学、南开大学、南昌大学等单位也有相关的研究成果。但有些国际音标没有Unicode码位,个别音标的字形标准也存在一定的争议,这些问题都需要进一步的探讨。
(二)汉字的数字化。汉语方言研究离不开中国古代小学著作及相关古文献,涉及到一些不常用汉字显示、输入和处理问题。随着汉字信息处理技术的发展,一系列汉字字符集标准和大字符集字库相继发布,在此基础上开发的四角号码、五笔字型、手写输入等多种超大字符集输入法较好地解决了汉字的数字化问题②。
除了充分利用上述成果外,方言工作者还应对数字化资料的格式、标准等问题形成操作性、兼容性强的规范,这将极大有利于学术成果的交流与共享。目前在这方面还鲜见相关的研究成果。
二、汉语方言数据库
汉语方言数据库是利用数据库技术整合各种数字化方言资料的数据集合,能进行查询、排比、比较、计算等复杂工作。方言数据库多采用Foxpro、Access等关系型数据库建库,可分为不同的类型:从整合的资料来看,可以分为语音数据库、词汇数据库、声学参数数据库等;从研究用途来看,可分以综合数据库和特定数据库;从涉及的方言数量来看,可分为大型数据库和中小型数据库。学者可以根据自己的研究目的建立不同类型的方言数据库。以下是几种有代表性的方言数据库:
(一)DOC(汉语方言计算机字典)。DOC是汉语方言数据库建设的早期成果,它整合了《汉语方音字汇》中17个方言点的读音资料③,在此基础上开展的“词汇扩散论”、方言关系等研究取得了丰硕的成果。
(二)“汉藏语同源词数据库检索系统”。收集12个汉语方言点数据。该数据库将语言的语言信息、结构属性、描述属性等整合在一起,信息量极大④。
(三)“汉语方言声调数据库”。将已发表的汉语方言文献中的声调资料制作成数据库,可对调类、调值、调型、连调和变调等进行查询⑤。
(四)潘悟云在其开发的“汉语方言计算机处理系统”的基础上制作了方言语音和词汇数据库,并在东方语言学网上开放了部分查询服务。
从方言数据库发展的现状看,语音数据库发展最早、成果最多,理论和技术已比较成熟,但在数据库字段及数据结构设计等问题上需要进一步优化和规范;方言词汇和语法数据库仍处于起步阶段,日益受到语言学家的重视,如麦耘主持的“汉语方言词汇数据库”、刘丹青主持的“方言语法语料库”等,须加强此类方言数据库的理论和技术研究。此外,不少语言学家制作了方言音档,并将其与方言数据库整合起来,如侯精一主持的“现代汉语方言音库”,刘俐李主持的“汉语方言语音词汇库”等,这也是方言数据库发展的一个趋势。
三、方言自动处理软件
方言自动处理软件是计算机辅助方言研究的一项重要内容,它能使方言学者从繁复的整理工作中解脱出来,将精力放在分析和解决问题上。方言自动处理软件多以处理方言语音为主,它利用汉语方言之间及方言与中古音的对应规律编制计算机程序,实现研究工作的自动化,提高研究的准确度,拓展研究的广度和深度。方言自动处理软件应具有方言音系整理,方言音韵比较,机助建库和相关图表输出等主要功能。
常见的汉语方言自动处理软件有如下几种:吴道勤主持研制的“方言微机处理系统”及其后续版本“方言音系整理系统”⑥,广西师范大学刘村汉利基于EXCEL开发的“方言字音处理系统”、复旦大学中文系开发的“汉语方言研究助手”等。这些软件基本实现了预定的功能,但界面的友好性,操作的便捷性都存在一些问题,而且难以胜任大规模的方言比较研究。上海师范大学潘悟云教授基于Visual Foxpro开发“汉语方言计算机处理系统”较好地克服了上述问题,代表了此类软件的最高水平。
目前,汉语方言处理软件已经能够基本满足方言整理工作的需要,但在通用性、简便性上仍需进一步改善,使更多的方言学者能够顺利应用相关成果。
四、计算机技术与方言实验语音研究
随着计算机技术的发展,先进的电子实验仪器不断涌现,给方言实验语音研究的普及和发展创造了有利的条件。
(一)方言语音声学研究。传统的语音声学研究多使用语图仪,而随着数字化的语音分析软件的出现,在个人电脑上就可以开展语音实验研究。现在较常用的语音分析软件有KAY公司的CSL系列软件,南开大学开发的“桌上语音工作室”,荷兰语音学家开发的PRAAT软件以及美国暑期语言学院制作的SA软件等。利用这些软件,学者在方言语音特别是声调、元音的研究上取得了丰硕的成果。
(二)方言语音生理实验。方言语音生理研究是对方言语音发声、调音器官具体性质的研究,对方言语音的特性和一些疑难问题的解决具有重要的价值。实验使用的电子设备主要有鼻流计、动态腭位(EPG)、电磁发音仪(EMA)等。这些设备较为昂贵,使用范围不广,取得的成果主要集中于对上海、宁波等地方言的研究。
五、计算机技术与汉语方言地图绘制
汉语方言地理学是汉语方言研究的重要部门,而方言地图则是汉语方言地理学的必要内容。传统汉语方言地图的绘制存在周期长,成本高,不利于推广等缺点,计算机技术使方言地图的绘制更为便捷、功能更强大。
(一)图像处理软件在绘制方言地图中的运用。主要是利用Window画图工具、Coraldraw、Photoshop等图像处理软件对方言地图进行绘制、处理和修改。
(二)方言地图绘制软件的开发和应用。20世纪80年代就有学者在DOS系统下开展这项研究⑦,现在较常用的方言地图软件有“汉语方言计算机处理系统”中附带的方言地图软件,日本学者福嶋秩子开发的SEAL软件等。自行开发的方言地图软件功能少、绘图信息量不大,但操作较为简便,适于在一般学者中推广。
(三)利用MapInfo和Arcview等地理信息系统开发方言地理信息系统。方言地理信息系统突破传统方言地图的形式,功能强大,成为未来方言地图的发展方向。
六、计算机辅助汉语方言教学
汉语方言教学包括国际音标的教学,听音记音训练以及田野调查练习。传统汉语方言教学多为口耳相授,随着计算机多媒体技术的发展,计算机辅助汉语方言教学逐步开始普及。
中国社会科学出版社出版的《音路历程》光盘中有赵元任和周殿福的国际音标发音,但国际音标录音不太全;瞿霭堂、劲松制作了汉语方言教学软件,不仅有完备的国际音标发音和唇型资料,还有上海话方言调查的练习程序;此外还有一些单位制作了国际音标学习软件或多媒体教程。
现有的计算机辅助汉语方言教学软件解决了方言教学中的几个难点问题,得到广泛的应用。但存在互动性较差、学习中缺乏相应的指导等缺点,使得教学效果欠理想。有必要在教学软件中实现自动判断发音准确度的功能,并加强训练及互动的环节。
七、结语
目前,计算机技术辅助汉语方言研究的发展方兴未艾。我们认为需要在以下几方面引起足够的重视:
(一)计算机技术与汉语方言研究的结合不是简单的技术问题,同样也是涉及到了研究理论、方法等诸多问题。在引入计算机技术的同时,也需要对相关问题的属性、特点、方法等问题进行深入研究。
(二)方言数字化、方言数据库和方言处理软件的建设亟需统筹规划、制定和完善相应的规范和标准,避免重复劳动和学术资源的浪费。在相关意见尚未统一之前,有必要采取一些过渡性的措施。
(三)计算机技术是汉语方言研究重要的工具,但它不能替代研究者的创造性思维。所以必须正确处理技术与学术的关系,使计算机技术更好地为方言研究服务。
基金项目:华中科技大学优秀博士学位论文基金资助项目(D0647)
注释:
①李龙,潘悟云.国际音标输入法及其实现[J].语言研究,2006,(3):67-70.
②尉迟治平,汤勤.论中文字符集、字库及输入法的研制[J].2006,(3):63-66.
③陆致极.汉语方言数量研究探索[M].北京:语文出版社,1992:12-14.
④江荻.汉藏语数据库检索软件研制报告[A].汉藏语同源研究(三)[M].南宁:广西民族出版社,2004:401-485.
⑤蒋平.“汉语方言声调资料库”的设计及其理论基础[J].方言.1999,(3):187-196.
⑥吴道勤.方言音系自动整理系统“FYCL系统”[J].湘潭大学学报社科版.1990,(4):112-115.
⑦熊正辉.电子计算机绘制方言地图的实验[A].庆祝吕叔湘先生从事语言教学与研究六十年论文集[M].北京:语文出版社,1985:138-141.
(周 杨 ,华中科技大学中文系)