小学语文教学语料库的设计与开发

来源 :课程教育研究·学法教法研究 | 被引量 : 0次 | 上传用户:shenyemaizui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】采用建立语料库的方式对提高小学语文教学质量有一定积极意义。但是需要在充分了解建立小学语文教学语料库的目的与大致方向的基础上进行设计与开发,才能够充分保证其完成建设后的作用的发挥。本文以小学语文教学语料库的设计与开发为中心,在完成设计的基础上进行开发,旨在为实际的小学语文教学提供切实可行的理论基础。
  【关键词】小学语文;语料库;设计与开发
  【中图分类号】G623.2
  0.引言
  小学语文教学语料库的设计与开发是以电子形式保存的语言材料,借助相关的技术手段,充分以小学语文教学为基石,有效解决在小学语文教学中存在的各种问题,特别是解决语文阅读资源的篇章检索、词语检索和句子检索。
  1.小学语文教学语料库的设计
  1.1小学语文教学语料库的设计原则
  本次建立的小学语文教学语料库是以人教版小学语文教科书为基础,充分以小学生的认知水平与阅读角度建立,在体现出一定的阅读趣味性的基础上充分贴合学生,因此在设计过程中语料库的建立收纳的内容主要以趣味性较强的儿童文学作品为主,例如各种儿歌,顺口溜,童话故事等等。各种材料的收集均体现出以学生为主的设计原则与设计理念[1]。另外在建立语料库时,需要充分结合资料的多样性,因为多样性的文学材料才能够更好的激发学生阅读兴趣[2]。另外,从语料库的容量、形式以及样本处理上都需要充分结合人教版小学语文语料库的教学与研究需求。后期为了能够方便检索,达到最佳的检索效果,需要将每一个收录进语料库的样本当做一条数据记录保存在数据库中,如此一来就十分方便后续的查找,甚至利用一条句子就能够进行全文的检索。
  1.2语料库设计的容量
  充分结合人教版的教科书,确定语料库中需要包含多少个词汇。由于在设计语料库的过程中不同的设计原则、设计方式其最终的语料库在内容、形式上都会不同。本次在设计的过程中,考虑到人教版小学语文教科书特点,将原始预料全部切分成为长度在2500-6000字次之内的一个片段,并以此作为样本。同时也考虑了实用整个原始文本作为样本的方式,但是考虑到后期的检索方式,因此暂不考虑[3]。考虑到本次语料库的建设主要是以后期的小学语文的拓展阅读提供良好的阅读资源,因此检索得到的结果一定要是一个完整的文本。所以综合性考虑,检索功能中使用关键词的方式,在结合人教版小学语文教科书特点的基础上设计语料库。
  1.3语料库设计的形式
  分析人教版小学语文教科书中的教学内容,考虑语文教学的特性。由于此次语料库的建设其内容全部都是属于文学一类,而文学类的内容其形式比较多样,而这一点也正好符合了小学语文教学与建立语料库的特点,形式的选择可以将趣味性比较丰富的儿歌、顺口溜、诗歌、童话、谜语、寓言故事等等收录其中。
  1.4语料库设计的处理
  本次的语料库的样本处理由于仅针对人教版的小学语文教科书,因此采用的是人工标注的形式,将收录的样本按照词性、语法、语义、语用等不同标签进行标注。另外考虑到语料库的检索功能的需求,此次语料库建设过程中采用了两种不同的检索方式,进行样本的处理。一种是将确定收录进语料库的样本划分成为一个一个的句子,然后将每一个句子以数据记录的方式输入进语料库中,利用检索工具使用关键词进行检索。另外一种则是将每一个语料样本作为一个数据记录输入进语料库中,同样利用检索功能使用关键词进行检索,最终目的是得到一个对全文的搜索。
  2.小学语文教学语料库的开发
  首选理清开发的过程,包含了采集语料、加工语料库、开发语料库的检索功能等。同时配备一定的技术手段,进行开发。
  2.1开发第一步——采集语料
  (1)可以直接从互联网上下载各种现成的资料,同样利用关键词搜索方式在百度上进行搜索,将需要的各种资料下载下来,作为语料库中的主要内容。
  (2)将从互联网上下载的所有资源进行处理,选择合适的文本形式,参考标准的格式本文进行所有资源的整理。
  2.2开发第二步——加工语料库
  对语料库进行加工实际上就是对语料库内容的加工,而根据语料库中的不同形式的内容其加工主要是针对句子的加工与篇章的加工。
  (1)针对句子的加工,主要是利用正则表达式将篇章划分为若干个句子,确定每个句子的长度并将划分好的句子输入进划定的句子数据库中。一般,判断是否为一个句子一般是看句子后面是否有“。”“?”“!”之类的符号,如果是英文中那就是“.”“?”“!”。
  (2)针对对一个篇章的加工,为了能够方便检索,需要对每一篇收录的文章进行关键词标注,这种标注可以采用人工标注或者自动标注的形式。两种标注形式都有其利弊[4]。人工标注其得到的结果更加容易理解,但是比较费时费力,另外准确率低于自动标注。而自动标注结果虽然可能不容易理解,但是十分适用于内容含量较大的语料库,十分省时省力,准确率一般会高于人工标注,并且这种标注是来源自真实文本,可信度较高。两者对比分析发现,利用计算机进行语料库的加工会更加有效。
  2.3开发第三部——开发语料库的检索功能
  (1)句子检索。句子检索可以使用关键词进行检索,利用某个关键词,另外设定跨距来限定关键词的左右语境范围。如果需要得到更多的检索结果需要扩大检索的上下文语境的范围。通过这种方式能够实现对关键词、短语等句子的检索,同时得到的检索结果使用者可以随意的复制与保存。
  (2)文章检索。文章的检索则包含了文章的作者、标题、出处甚至是整个文章的全文等等。针对标题、作者等可能重复性较高的可以使用模糊匹配功能,这点以输入法中的模糊音设置有一定的相似性。
  3.结语
  小学语文教学的语料库的设计目的在于为小学生提供适合不同年级的各种符合其认知水平的儿童文学作品,在丰富的小学语文教材资料的基础上帮助提高小学语文教学质量。这种通过书面语或者口语的样本汇集起来的实际上就是语文语言中的一种。不断的积累与汇集能够反映出小学语文在实际教学与应用中的情况,对我国小学语文教学的发展是很有积极作用的。
  【参考文献】
  [1]魏顺平,何克抗.小学语文教学语料库的设计与开发[J].中国电化教育,2007,13(06):66-69.
  [2]黄梅红.试析小学语文教学语料库的设计与开发[J].现代阅读(教育版),2013,19(10):220.
  [3]杨红.学语文教学语料库的设计与开发[J].课外语文(初中),2013,11(02):56.
  [4]马晓霞.浅议小学语文教学语料库的设计与开发[J].课程教育研究,2013,51(19):45-46.
其他文献
练习系统与课文系统、助读系统、知识系统一起并称为教科书的四大系统,是语文教科书的重要组成部分。在民国的小学语文教材中,也有练习系统。本论文以民国时期的小学语文教材《
长期演进(Long Term Evolution,LTE)技术作为当前通信的主流协议,在当前已经非常的成熟,其已经被应用于日常通信、国防安全、人工智能等多个领域。专网小型基站作为在此基础
针对具有长传播时延的多址系统 (如卫星通信系统 ) ,提出了主动重发的随机多址协议 .研究结果表明 :在ALOHA系统中 ,这种新协议可以以较小的吞吐量损失得到时延的显著减小 ;
采用矩量法对车载多天线间的相互干扰特性进行了分析,将多天线系统等效为微波网络,然后采用矩量法求该网络的导纳矩阵Y.利用该导纳矩阵对天线间互耦特性进行分析,同时计算天
<正> 泌尿系结石是外科常见急腹症之一。十几年来,我们对50例泌尿系结石病人均用猪苓汤合芍药甘草汤治疗,取得满意疗效,现总结如下。1 临床资料1.1 一般资料本组50例,男38例,
从教十一年了,一直担任班主任工作。对于教师生涯.我还是年轻教师,但是对于班主任一职倒也算“老人了”。十一年来一直担任班主任工作,在这个漫长而又特殊的时期里,对于班级管理,我
如果上帝给了世界十分美丽.九分给了香格里拉.剩下的一分给了世界上的其他地方;如果上帝给了人生十分精彩,九分给了游香格里拉者.剩下的一分给了世界上的其他人。
分析了Clos型大规模ATM交换网络中一种传统的分散式路由选择算法-直接对应(SM)算法,提出了一种新的Clos型交换网络结构和一种改进的路由选择算法。
【摘要】中等职业学校体育教学是培养各类实用型人才的素质的重要途径之一,本文结合职业学校的特点和职业学校体育教学的特殊性,对中职学校体育教学中的体育教学进行了探讨研究。  中职学校体育教学是职业教育的一个重要方面,结合中职学校的特点和中职学校体育教学的特殊性进行教学,是中职学校体育发展的需要,也是培养合格职业技术人才的需要,因此上好中职体育课具有十分重要的意义。  【关键词】中职学校 体育教学 探讨
要对曝气量进行有效控制,应首先对曝气池内溶解氧(DO)浓度进行准确的实时预测。用EFOR软件对污水处理过程进行模拟,得到的数据作为自适应神经模糊推理系统(Adaptive Neural N