论文部分内容阅读
[摘要]主要分析了边境少数民族地区普通话发音学习的现状,并结合普通话的特点提出一个边境少数民族普通话口语发音学习的系统构建。该系统充分利用了Siri语音识别技术作为系统对学习者的发音进行识别,云计算作为该系统的数据分析、数据保存以及建立资源池的平台,以此来解决边境地区道路不通网络,难以吸引高水平教师的问题。在该系统中,学习者既是系统的使用者也是系统的建设者;其他学习者评价学习者的发音使学习者更全面地了解自己在普通话口语发音中的不足;并可以大量保存少数民族的语言供其他学习者学习;系统将所有学习者分享的口语发音中评价最高的发音设定为默认发音,以此来激励学习者的学习。
[关键词]边境少数民族;普通话;系统构建
[中图分类号]H2;H102[文献标识码]A[文章编号]2095-0292(2013)05-0100-03
一、引言
(一)边境少数民族地区普通话发音学习的现状及意义
目前,信息社会的快速发展,导致了信息传递速度过快,加速了全球文化共同化的发展。全球不同文化正在经历着不同程度的整合,不仅中国的文化受到外国文化的冲击,外国文化也受到中国文化的影响。中国是一个多民族、多语言的国家,拥有56个民族和187种语言,300多种方言。虽然汉族人口占总人口的92%,但是普通话的普及率仅为总人口的54%。由于边境少数民族拥有自己的语言且对学习普通话缺少针对性的教育资源与方法以及对本民族语言或者方言缺乏保护意识。有些少数民族的年轻人已经缺少了对本民族语言的掌握,且由于教育资源和方法的局限性,对汉语普通话的掌握,尤其是发音缺乏矫正。
边境少数民族普通话口语发音的教育问题主要体现在学校和学生两个层面。学校层面主要体现在课程设置不合理以及教学方法陈旧等因素。学生层面主要体现在地域环境、民族母语以及心理等因素。比如:边境地区的交通、信息不方便,难以吸引优秀的教师;少数民族接触标准普通话的机会较少、部分少数民族语的发音与普通话的发音的区别方法以及少数民族没有意识到普通话发音的重要性。这些因素都极大地影响着边境少数民族的普通话发音,也导致了汉语普通话作为中国官方语言,中国普及普通话发展的滞涩。
现在研究边境少数民族普通话口语发音问题的研究者较少,主要在边境少数民族学习者的思想、培养学习者的兴趣、课程改革以及部分研究者对个别边境少数民族学习者的《普通话水平测试》的答案进行校对更正等方面进行探索。但是缺少利用计算机技术以及网络来解决边境少数民族普通话发音问题的研究。
边境少数民族普通话口语发音学习的系统解决了边境地区在普通话口语发音学习中的教师水平低、教学资源匮乏等问题,突破边境地区交通落后的问题,云计算系统平台大大减少了系统终端的成本,并可以减少少数民族语言的逐渐缺失。
(二)Siri技术
Siri的全称是个人自动智能助理(Personalized Intelligent Assistant),并非苹果公司自主研发,最初是苹果AppStore的一款应用,苹果公司发现后很快于2010年4月从斯坦福研究机构国际智能中心(SRI)处收购而来,传言收购价格在2亿美元左右,之后很快Siri从AppStore下架并集成进入IPhone 4S。
Siri主要是利用人工智能和云计算两项技术可以提供给用户服务。Siri提供给用户服务分为前端技术和后台技术。前端技术主要是主要是语音识别以及语音合成技术。语音识别技术是把用户平时的口语转化成文字,这需要强大的语音知识库,因此,需要用到云计算技术。后台技术目的就是处理用户的请求并返回最匹配的结果,这些请求类型很多,千奇百怪。基本的结构是分析用户的输入(已经通过语音转化成文字),根据输入类型,分别采用合适的技术(合适的技术后面)进行处理。
(三)云计算
云计算(cloud computing)即基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。也就是说,用户可以通过终端链接网络,向云服务器提出服务请求,云服务器根据自己的能力通过网络向用户提供服务的平台。云计算最大的优点在于,它突破了终端自身的限制,运算与存储在云计算服务器进行,终端只是作为输出设备,降低了终端的成本。
二、边境少数民族普通话口语发音学习模型的设计
(一)边境少数民族普通话口语发音学习的系统功能模块
针对普通话中拼音字母构成字,字构成词,词组构成句子,句子构成文章的特点。边境少数民族普通话发音学习模型分为拼音字母学习模块、字词发音学习模块、句子文章发音学习模块和发音矫正学习模块。学习者的发音记录可以选择是否分享到资源池中,如果选择分享到资源池,则其他学习者可以对该学习者的口语发音进行矫正评价;如果选择不分享到资源池中,则学习者可以选择重新发音、选择模块、退出等操作。学习者最初注册可得到拼音字母发音学习模块、字词发音学习模块、文章发音学习模块共2小时的使用时间,发音矫正模块不限使用时间。学习者需要对资源池中其他学习者分享的口语发音进行评价来赚取拼音字母发音学习模块、字词发音学习模块、文章发音学习模块的使用时间。边境少数民族普通话学习口语发音系统的功能模块如图1所示:
1拼音字母学习模块。学习者从该模块学习汉语拼音字母的发音。该模块数据库由普通话口语专家录取所得。
2字词发音学习模块。学习者可以从该模块学习普通话的字词的发音。该模块的数据库最初由管理员建立,而后将所有学习者分享的口语发音中评价最高的发音设定为默认发音。
3句子文章发音学习模块。学习者可以从该模块学习句子、段落、诗词或文章的发音。该模块与字词模块类似,只是该模块并没有最初的语音识别技术。资源池由字词模块、文章跟读模块中每字分节存储的发音资源以及发音矫正模块中每字分节存储的发音资源构成。 4发音矫正学习模块。学习者可以在该模块对自己的发音进行矫正。资源池由字词模块、文章跟读模块中每字分节存储的发音资源以及发音矫正模块中每字分节存储的发音资源构成。此模块没有使用时间限制。
(二)边境少数民族普通话口语发音口语发音学习的系统流程
边境少数民族普通话口语发音学习的系统功能模块流程如下:
1学习者选择拼音字母学习模块的系统流程。
学习者进入学习字母阶段后,学习者选择需要学习的拼音字母。随后,系统在资源池中获取字母发音与字母口型图,再由学习者跟读拼音字母,系统随后会重复该字母的默认发音与学习者的发音,并重复给学习者收听学习。学习者比较自己的发音与默认字母发音的区别进行学习。
2学习者选择字词学习模块的系统流程如图2所示:
学习者选择字词学习后,可以通过普通话语音发音让系统中的Siri语音识别文字,如果识别成功,系统确定云计算服务器的资源池中的普通话默认发音与民族语言发音。学习者需要选择学习普通话或者民族语言,系统首先读出默认字词的发音并在终端显示器上显示发音的字词,学习者再根据终端显示器上的字词重复发音。而后系统播放默认发音与学习者自己的发音,学习者比较自己的发音与默认字母发音的区别进行学习。如果最初无法识别学习者的发音,系统将提示再次通过语音发音或者输入文字。学习者可以选择再次通过语音发音或者通过终端的输入设备将想要学习的文字输入到系统中。在该模块中,系统只能识别单字、儿化音的词以及成语。对于成语的发音,系统将学习者的成语发音分节成单字进行记录,所以系统在对成语进行发音前根据资源池中所有学习者分享的每字的发音进行组合,形成成语的发音。此模块的汉字输入只能识别汉语,语言只能识别普通话以及掌握人数较多的少数民族语言。但是学习者可以将本民族其他语言或方言保存分享到资源池的相关分类中记录,供其他学习者参考学习。
3学习者选择文章跟读模块的系统流程。
学习者选择文章跟读,首先选择需要学习的句子、段落、诗词或是文章,再选择普通话还是少数民族语言。而后听到系统中对于选择的句子、段落、诗词或是文章的语言发音,终端显示器上显示选择的句子、段落、诗词、文章。随后学习者再模仿跟读,跟读完成后系统播放默认发音与学习者自己的发音,学习者比较自己的发音与默认字母发音的区别进行学习。
4学习者选择发音矫正模块的系统流程如图3所示:
学习者首先选择矫正发音学习,学习者需要选择汉语普通话还是其他民族语言。如果选择普通话,可以利用Siri语音识别或者文字输入向系统提交要矫正的字词发音;如果选择其他民族语言,只能利用文字输入向系统提交要矫正的字词发音。选择完语言类别后跟读云计算服务器提供的发音,学习者选择需要矫正的发音保存到云计算服务器中,其他学习者评价该学习者的发音(可以是自己发音,也可以是就部分发音进行评价),由学习者学习。其他学习者根据评价的次数和有效性赚取其他三个模块的使用时间。
三、结语
说好普通话、用好规范字、提高语言文字应用能力,是素质教育的重要内容。做好学校普及普通话和用字规范化工作,对于掌握科学文化知识、培养创新精神和实践能力、全面提高素质,对于继承和弘扬中华民族优秀的传统文化,培养爱国主义情操、增强民族凝聚力都具有重要意义。少数民族文化正在日渐消失,保护少数民族语言是保护我国文化的一个重要目标。Siri的语音识别技术已经非常成熟,云计算则可以突破边境少数民族地区的交通不便、基础设备昂贵等问题,让边境少数民族学习者随时随地学习标准普通话以及保存本民族语言。在边境少数民族普通话学习的软件中,学习者可以通过区别系统的默认发音或者其他学习者的评价进行交互式学习。在系统的资源库建设中,除了汉语拼音模块需要管理员建立资源库,其他模块中学习者既是该软件的使用者,也是该软件资源库的建设者。所以,边境少数民族普通话口语发音的系统构建是可行的。
[参考文献]
[1]孙惠欣.少数民族地区高校普通话教学现状及改进策略[J].现代教育科学,2009(1).
[2]朱道明.普通话教程[M].武汉:华中师范大学出版社,1991.
[3][英]萨默维尔软件工程[M].第9版程成,等,译.北京:机械工业出版社,2011.
[责任编辑张峰]
[关键词]边境少数民族;普通话;系统构建
[中图分类号]H2;H102[文献标识码]A[文章编号]2095-0292(2013)05-0100-03
一、引言
(一)边境少数民族地区普通话发音学习的现状及意义
目前,信息社会的快速发展,导致了信息传递速度过快,加速了全球文化共同化的发展。全球不同文化正在经历着不同程度的整合,不仅中国的文化受到外国文化的冲击,外国文化也受到中国文化的影响。中国是一个多民族、多语言的国家,拥有56个民族和187种语言,300多种方言。虽然汉族人口占总人口的92%,但是普通话的普及率仅为总人口的54%。由于边境少数民族拥有自己的语言且对学习普通话缺少针对性的教育资源与方法以及对本民族语言或者方言缺乏保护意识。有些少数民族的年轻人已经缺少了对本民族语言的掌握,且由于教育资源和方法的局限性,对汉语普通话的掌握,尤其是发音缺乏矫正。
边境少数民族普通话口语发音的教育问题主要体现在学校和学生两个层面。学校层面主要体现在课程设置不合理以及教学方法陈旧等因素。学生层面主要体现在地域环境、民族母语以及心理等因素。比如:边境地区的交通、信息不方便,难以吸引优秀的教师;少数民族接触标准普通话的机会较少、部分少数民族语的发音与普通话的发音的区别方法以及少数民族没有意识到普通话发音的重要性。这些因素都极大地影响着边境少数民族的普通话发音,也导致了汉语普通话作为中国官方语言,中国普及普通话发展的滞涩。
现在研究边境少数民族普通话口语发音问题的研究者较少,主要在边境少数民族学习者的思想、培养学习者的兴趣、课程改革以及部分研究者对个别边境少数民族学习者的《普通话水平测试》的答案进行校对更正等方面进行探索。但是缺少利用计算机技术以及网络来解决边境少数民族普通话发音问题的研究。
边境少数民族普通话口语发音学习的系统解决了边境地区在普通话口语发音学习中的教师水平低、教学资源匮乏等问题,突破边境地区交通落后的问题,云计算系统平台大大减少了系统终端的成本,并可以减少少数民族语言的逐渐缺失。
(二)Siri技术
Siri的全称是个人自动智能助理(Personalized Intelligent Assistant),并非苹果公司自主研发,最初是苹果AppStore的一款应用,苹果公司发现后很快于2010年4月从斯坦福研究机构国际智能中心(SRI)处收购而来,传言收购价格在2亿美元左右,之后很快Siri从AppStore下架并集成进入IPhone 4S。
Siri主要是利用人工智能和云计算两项技术可以提供给用户服务。Siri提供给用户服务分为前端技术和后台技术。前端技术主要是主要是语音识别以及语音合成技术。语音识别技术是把用户平时的口语转化成文字,这需要强大的语音知识库,因此,需要用到云计算技术。后台技术目的就是处理用户的请求并返回最匹配的结果,这些请求类型很多,千奇百怪。基本的结构是分析用户的输入(已经通过语音转化成文字),根据输入类型,分别采用合适的技术(合适的技术后面)进行处理。
(三)云计算
云计算(cloud computing)即基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。也就是说,用户可以通过终端链接网络,向云服务器提出服务请求,云服务器根据自己的能力通过网络向用户提供服务的平台。云计算最大的优点在于,它突破了终端自身的限制,运算与存储在云计算服务器进行,终端只是作为输出设备,降低了终端的成本。
二、边境少数民族普通话口语发音学习模型的设计
(一)边境少数民族普通话口语发音学习的系统功能模块
针对普通话中拼音字母构成字,字构成词,词组构成句子,句子构成文章的特点。边境少数民族普通话发音学习模型分为拼音字母学习模块、字词发音学习模块、句子文章发音学习模块和发音矫正学习模块。学习者的发音记录可以选择是否分享到资源池中,如果选择分享到资源池,则其他学习者可以对该学习者的口语发音进行矫正评价;如果选择不分享到资源池中,则学习者可以选择重新发音、选择模块、退出等操作。学习者最初注册可得到拼音字母发音学习模块、字词发音学习模块、文章发音学习模块共2小时的使用时间,发音矫正模块不限使用时间。学习者需要对资源池中其他学习者分享的口语发音进行评价来赚取拼音字母发音学习模块、字词发音学习模块、文章发音学习模块的使用时间。边境少数民族普通话学习口语发音系统的功能模块如图1所示:
1拼音字母学习模块。学习者从该模块学习汉语拼音字母的发音。该模块数据库由普通话口语专家录取所得。
2字词发音学习模块。学习者可以从该模块学习普通话的字词的发音。该模块的数据库最初由管理员建立,而后将所有学习者分享的口语发音中评价最高的发音设定为默认发音。
3句子文章发音学习模块。学习者可以从该模块学习句子、段落、诗词或文章的发音。该模块与字词模块类似,只是该模块并没有最初的语音识别技术。资源池由字词模块、文章跟读模块中每字分节存储的发音资源以及发音矫正模块中每字分节存储的发音资源构成。 4发音矫正学习模块。学习者可以在该模块对自己的发音进行矫正。资源池由字词模块、文章跟读模块中每字分节存储的发音资源以及发音矫正模块中每字分节存储的发音资源构成。此模块没有使用时间限制。
(二)边境少数民族普通话口语发音口语发音学习的系统流程
边境少数民族普通话口语发音学习的系统功能模块流程如下:
1学习者选择拼音字母学习模块的系统流程。
学习者进入学习字母阶段后,学习者选择需要学习的拼音字母。随后,系统在资源池中获取字母发音与字母口型图,再由学习者跟读拼音字母,系统随后会重复该字母的默认发音与学习者的发音,并重复给学习者收听学习。学习者比较自己的发音与默认字母发音的区别进行学习。
2学习者选择字词学习模块的系统流程如图2所示:
学习者选择字词学习后,可以通过普通话语音发音让系统中的Siri语音识别文字,如果识别成功,系统确定云计算服务器的资源池中的普通话默认发音与民族语言发音。学习者需要选择学习普通话或者民族语言,系统首先读出默认字词的发音并在终端显示器上显示发音的字词,学习者再根据终端显示器上的字词重复发音。而后系统播放默认发音与学习者自己的发音,学习者比较自己的发音与默认字母发音的区别进行学习。如果最初无法识别学习者的发音,系统将提示再次通过语音发音或者输入文字。学习者可以选择再次通过语音发音或者通过终端的输入设备将想要学习的文字输入到系统中。在该模块中,系统只能识别单字、儿化音的词以及成语。对于成语的发音,系统将学习者的成语发音分节成单字进行记录,所以系统在对成语进行发音前根据资源池中所有学习者分享的每字的发音进行组合,形成成语的发音。此模块的汉字输入只能识别汉语,语言只能识别普通话以及掌握人数较多的少数民族语言。但是学习者可以将本民族其他语言或方言保存分享到资源池的相关分类中记录,供其他学习者参考学习。
3学习者选择文章跟读模块的系统流程。
学习者选择文章跟读,首先选择需要学习的句子、段落、诗词或是文章,再选择普通话还是少数民族语言。而后听到系统中对于选择的句子、段落、诗词或是文章的语言发音,终端显示器上显示选择的句子、段落、诗词、文章。随后学习者再模仿跟读,跟读完成后系统播放默认发音与学习者自己的发音,学习者比较自己的发音与默认字母发音的区别进行学习。
4学习者选择发音矫正模块的系统流程如图3所示:
学习者首先选择矫正发音学习,学习者需要选择汉语普通话还是其他民族语言。如果选择普通话,可以利用Siri语音识别或者文字输入向系统提交要矫正的字词发音;如果选择其他民族语言,只能利用文字输入向系统提交要矫正的字词发音。选择完语言类别后跟读云计算服务器提供的发音,学习者选择需要矫正的发音保存到云计算服务器中,其他学习者评价该学习者的发音(可以是自己发音,也可以是就部分发音进行评价),由学习者学习。其他学习者根据评价的次数和有效性赚取其他三个模块的使用时间。
三、结语
说好普通话、用好规范字、提高语言文字应用能力,是素质教育的重要内容。做好学校普及普通话和用字规范化工作,对于掌握科学文化知识、培养创新精神和实践能力、全面提高素质,对于继承和弘扬中华民族优秀的传统文化,培养爱国主义情操、增强民族凝聚力都具有重要意义。少数民族文化正在日渐消失,保护少数民族语言是保护我国文化的一个重要目标。Siri的语音识别技术已经非常成熟,云计算则可以突破边境少数民族地区的交通不便、基础设备昂贵等问题,让边境少数民族学习者随时随地学习标准普通话以及保存本民族语言。在边境少数民族普通话学习的软件中,学习者可以通过区别系统的默认发音或者其他学习者的评价进行交互式学习。在系统的资源库建设中,除了汉语拼音模块需要管理员建立资源库,其他模块中学习者既是该软件的使用者,也是该软件资源库的建设者。所以,边境少数民族普通话口语发音的系统构建是可行的。
[参考文献]
[1]孙惠欣.少数民族地区高校普通话教学现状及改进策略[J].现代教育科学,2009(1).
[2]朱道明.普通话教程[M].武汉:华中师范大学出版社,1991.
[3][英]萨默维尔软件工程[M].第9版程成,等,译.北京:机械工业出版社,2011.
[责任编辑张峰]