HSK动态口语语料库的语料转写研究

来源 :第七届全国语言文字应用学术研讨会 | 被引量 : 0次 | 上传用户:wuweiguowwg32691819
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文将借鉴国内外相关语料库的做法,重点探讨这个问题,主要包括转写内容、转写中遇到的问题和转写规则三个部分.口语语料库建设最关键也是最耗时、耗力的工作是语料的转写与标注,在真实性原则与完整性原则的指导下进行。转写中遇到的最大问题是单纯汉字转写的不准确性,转写时对于非正常停顿的呈现是非常必要和有意义的,学习者在口语表达中还会出现各种重复在转写过程中也应该进行相应的呈现。针对单纯汉字转写的不准确性问题,建议采用拼音汉字双重转写。第一层是汉语拼音层,第二层是汉字层。关于停顿,运用语图仪等设备,采用科学的研究方法,研究停顿的时间问题,探讨其可能负载的语用意义,进而进行科学有效地转写。关于重复的问题,建议只转写一次,然后在重复的单音节字词后面加[wr],短语后面加[pr],句子后面加[sr]。对于内容无法分辨或完全听不清的部分,借鉴英语口语语料库的转写方法,无法辨别的用“”表示,一个“”代表一个音节,像一些人名地名;如果是整个语句没有听清,我们用[X]表示。对于数字的转写,建议不用阿拉伯数字,而使用汉字。
其他文献
<正> 上个世纪四十年代,有一个外国人向世人提出了这样一个问题:到哪里去看中国?然后,他自问自答地写道:“我们是否能够说因为我们造访过或者在上海居住过多年,就说我们了解
目的观察抗脑抗体对脑胶质瘤细胞C6的增殖、凋亡和侵袭力的影响。方法将C6细胞分为实验组和对照组,实验组加入不同浓度的抗脑抗体,对照组不加抗脑抗体;分别采用MTT法、流式细胞
仔猪出生后的死亡大部分发生在30天以内,尤其是第1星期,死亡率常占总死亡率的60%。究其原因,主要有初生仔猪被母猪压死、自身抵抗力差发生黄痢、感冒等病致死。若能搞好仔猪出生
三峡工程已建的施工通航设施,引用1998年长江发生特大洪水期间施工通航的统计资料,分别对三峡工程二期施工通航设施导流明渠、临时船闸、翻坝码头的通过能力进行了深入分析,对导流明
一期导流工程纵向围堰坝身段在永久暴露面及施工仓面RCC上发现Ⅲ、Ⅳ类裂缝 ,其主要原因是基础固结灌浆造成长间歇 ,后迂寒潮袭击 ,加之结构长宽比大 ,在基础约束应力和寒潮
在介绍了蒙特卡罗(Monte Carlo)分析方法基本原理的基础上,对发动机点火工作中大电流恒流源电路进行了MonteCarlo分析。系统以高速运算放大器为核心,采用PID控制,应用Multisim
伴随三峡工程10年建设的脚步,库区各级政府10年来开展了大规模的新城建设和城乡移民安置,应该说:任务艰巨,困难重重,成效显著!
目前有关太阳能电池的数学模型已有不少,但是大部分都太理想化和实际差距比较大。基于此讨论了满足工程应用精度且便于运算的太阳能电池数学模型。该模型的特点是仅采用生产
在本工作中,通过在氮气保护下热解Pt纳米颗粒结合的ZIF-67制备了由ZIF-67原位产生的氮掺杂碳负载Pt Co合金纳米颗粒组成的Pt Co-NC复合催化剂。通过X射线衍射,扫描电子显微镜
粒子系统一直是模拟喷泉特效最常用的方法,但是当喷泉规模较大时,每一帧都要计算大量的粒子属性,使喷泉的模拟很难达到实时。针对以上问题,提出基于GPU加速的粒子系统喷泉模拟方法,充分发挥GPU强大的运算能力,并与CPU配合以弥补GPU的不足,大大地提高了粒子系统的运行速度,使几百万数量的喷泉粒子能够实时绘制。同时还提出喷泉水雾的生成方法,使喷泉效果更加逼真。