网络环境下智能辅助英语教学语料库的建设

来源 :中国教育信息化·基础教育 | 被引量 : 0次 | 上传用户:wangjuekenan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
   摘要: 网络技术的快速发展,使网络成为最具潜力的教学工具。利用网络教学资源库进行英语教学不仅提高了教学资源的利用率,而且提高了教学质量,使得它与传统的教学相比,具有很大优越性。本文分析了网络环境下的英语智能信息检索语料库,结合教学中的具体应用,证明该语料库的建立在辅助教学中许多环节上都能减轻师生学习负担,提升教学效果,改善工作效率。
   关键词: 英语;辅助教学;智能;语料库
   中图分类号:G434 文献标识码:A 文章编号:1673-8454(2008)10-0007-03
  
   一、引言
  
  随着教育信息化建设的不断深入,计算机与互联网等设施在中小学得到了普及与应用,网络化教育成为一个辅助教学的重要工具,而作为网络化教育核心之一的数据库的功能则构成了一个重要的教育信息资源。近年来,语料库在机器辅助翻译和教学特别是英语教学中的应用已经得到了广泛的认可,但是作为一项重要的基础教育资源,专门针对我国中学英语教与学的语料库仍处于滞后的状态,指导我国中学英语教师和学生自主查阅学习的语料库还没有进行整合,这极大地影响了我国的相关理论研究和技术应用以及英语教学的发展。
   对于中国的英语口语学习者来说,在英语学习和应用中通常有两种困难:说出英语是否正确或地道;在某种情况下,该如何找到与汉语中相对应的英文表达。为了解决这两种问题,本研究将英语学科教育与人机交互技术、教育技术和自然语言处理技术结合起来,实现了对英语口语的词法、语法的检查和纠正功能,并为英语学习者提供英文的更地道说法,从而帮助他们更好地学习语言;同时提供相应汉语到英语的转换提示,用户利用提示转化成英语,从而达到学习的目的。
  
   二、语料库的主要关键技术
  
  为了满足英语学科教育与教育信息化整合需要,实现我国的科教兴国,教育技术化的目标,本语料库以辅助中学英语学习为切入点,实现基于文本的智能教学平台、基于网络辅助英语学习的自主学习模式和探索学习模式。针对英语学习中的主要问题,研究的主要内容包括:英汉口语双语语料库和知识库的建设方法;英语学习中语句的常见错误分析;英语的基本语法、词法分析以及错误预测与纠正方法;基于上下文分析的英语语块输入法;汉语口语的英语口语的表示提示。整个平台关键技术问题可以具体描述如下:
   1.建立一个可扩展的英汉双向语料库
  内容涵盖初中、高中阶段的英语学习。语言是一种以实际运用为主(perform)的技能,所以作为一个合格的口语语料库必须为用户提供口语表达的正确判断和说法的提示。为了实现口语资料的共享和重用,合理的口语语料库规范和语料标注是必经之路,为快速的收集语料资源提供保证。其研究包括双语对齐方法、场景分类、关键字提取、自动消重和权重设置等。
   2.英汉双语的语言知识库的建设
   在英汉双向语料库的基础上,提取语言学知识(competence),为用户提供依据,同时语言知识为学习者的语言录入的正确性判断提供直接依据,其采集过程通过语言专家手工和机器学习相接合的方法来完成。采用何种机器学习方法对语料库进行统计机器学习获得在英文使用的各种知识是本项目的研究重点之一,这将使整个语言知识具有扩展性。(如:单词的中文译文的使用概率;非英语短语的英语单词之间搭配概率。)
   3.以学习者为中心的辅助提示、交互技术
  从现代的教育心理学和教育技术角度来讲,我们应当提供给学习者合适的难度及方法,使得学习可以更加的快乐,从而取得更好的学习效果。为避免出现给用户的提示与其外语水平不适当,系统应首先对用户当前水平进行测试,按照学习者的水平进行个性化的提示内容。为达到良好的纠错效果,需要以人机交互理论为基础,调查学习者在英语口语学习中的常见错误,并进行分析和归纳,为系统更准确地预测用户错误、进行错误提示和纠错提供帮助。由于整个软件平台面向英语学习,为了使得学习者集中精力在语言的学习中,需要做到人机交互界面自然、简单、和谐,尽量避免复杂操作,把因为软件操作而影响英语学习的副作用降到最低。
   4.基于语料库统计与上下文分析的英语词性判断方法
  因为在英文中,一词多词性非常普遍,所以在语法分析中确定其在上下文中的正确词性就显得尤为重要。现有语料库统计中的词性统计体现了单词词义和词性在口语中使用的基本规律,再结合应用上下文的搭配关系使算法能更准确地判断词性。
   5.英文输入中真词错误的检查方法
  真词错误是指出错字符串是词典中的正确词,它为拼写错误检查和语法检查增加了困难,对词典中单词按词形相似性进行聚类将为寻找这种错误提供基础,再结合上下文信息及相似词之间的用法知识和使用习惯,将为真词错误检查提供比较好的方法。
   6.面向词法、语法的用户意图预测技术
  由于时态、一些词法的选择需要从整体上进行考虑,部分错误从整体上考虑会合适。因此,事先对用户打算使用的语法进行预测,能更有效的纠正其中的错误,这需要事先对用户使用的模式进行归纳,然后对相似性计算来预测出的最可能情况进行错误纠正,从而达到良好的效果。
   7.当前英语口语语句的地道表述方式预测
  学习者学习英语时,很难确定自己所说的英文是否是地道说法。利用上下文分析对当前对话进行场景预测,再结合当前语句分析,给出其地道英文说法或提示。
   8.汉语到英文的辅助翻译方法
   通过为汉语口语语句建立起一种合适的提示机制,并能让学习者自己完成对整个句子的英文表达,以帮助学习者达到良好的学习效果。由于英文口语具有很多句子层面的惯用法,这时整句搜索和翻译比较合适。而以短语层面惯用的语句中,需要确定场景关键词、汉语语句切分、汉语语句相似度计算等技术进行研究以实现基于实例的翻译提示。由于语言具有灵活性,经常存在一词多义和一义多词现象,考虑同义词进行汉语语句相似度计算,将提高匹配搜索效果。因此,本部分主要针对基于双向语料库的汉语语句切分技术、考虑同义词的汉语语句相似度计算、汉语口语语句到地道英语口语语句的预测三个方面进行研究。
  
   三、语料库的用途
  
   语料库的研究提供语言学习者两种语言上不同的表达方式,通过对比观察,从而达到学习外语的目的,减轻母语对外语学习的负迁移,鼓励学生在分析语料的基础上归纳语言规律。学习者可以通过检索程序从语料库中提取所有包含关键词的语句,进行对比研究和词语分析,进而达到归纳语言现象。语料库的建立以帮助学习者说出地道的英文为目标,为他们提供良好的、基于文本输入的英语辅助学习平台,主要为以下几点:
   1.本语料库的建立对英语学习者主要有以下帮助
   (1)实现英语语法、词法分析和错误纠正
  词法、语法是英语学习中的一项重要内容。学习者在写作、口语学习过程中,系统提示用户拼写错误、搭配错误、时态错误等,并提供可选项,通过给用户逐渐的、不断的认知提示,帮助加深印象,进而帮助用户逐渐掌握各项语法,从而减轻用户学习语法的痛苦,起到语言习得的良好效果。
   (2)提供地道的英文说法提示
  提示有助于学习者达到良好的学习效果。对于解决学习者在知道中文中惯用法,但却找不到在英语中不同层面相对应的语句,本语料库通过建立起一种合适的提示机制,通过整句搜索和整句翻译等让学习者自己完成对句子的英文表达(包括日常用语与书面语)。短语层面惯用的语句中,需要确定场景关键词、汉语语句切分、汉语语句相似度计算等技术进行研究以实现基于实例的翻译提示。由于语言具有灵活性,经常存在一词多义和一义多词现象,考虑同义词进行汉语语句相似度计算,将提高匹配搜索效果。
   (3)帮助学习者总结语言知识
  通过对学习者的语言运用能力的提示帮助,进一步使用户总结出一定的语言知识。学生通过查询在语境中看到特定词和结构的意义和句法特征,可以建立使用词汇的语境知识看到正确的、合适的用法。
   (4)探索一种适合中学生的语料库教学法
  采用“结构化块输入(structured block input)”,即应用经过处理的输入块驱使学习者注意特殊的语言属性。现代语料库语言学提供的语料库方法是应用以计算机为存储介质的语料库对大量语言运用进行分析,以实际使用中语言现象出现频率为依据研究语言在现实使用中的规律。联想、记忆的按超文本结构组织的大规模的知识库与信息库,易于激发学习者的兴趣,实现探索式、发现式和创新式学习。
   2.为我国的初、高中英语教师提供丰富的备课参考资料
   适应不同年级的学习者需要的数据集合可以帮助英语教师定位查询出现keywords的课文、一些相应的语法点以及对应的题目及答案。
   检索结果的呈现形式直观明了,为学习和研究关键词创造捷径。语料库检索通常以在文中的关键词(keyword-in-context)找出所需要检索的内容,检索的关键词位于上下文的中心。这一呈现形式有助于读者将其目光保持于最佳位置,迅速扫描检索结果,注意到搜索关键词的上下文结构。
   检索结果可呈现供分析研究关键词用的上下文。这些上下文能够详细展示关键词的语言行为,帮助促进语言学习者对目的词汇的观察和区分,并对目的词汇的典型用法有所接触和了解。
  
   四、结束语
  
  网络环境下针对中学英语教学智能辅助学习语料库的建立为教师的教、学生的学提供了大量的真实语料,适应了新形势下的英语学科与教育技术相结合的特点,以促进信息技术与英语学科教学的有机结合,促进我国中学英语教育教学向“主体性”、“探究性”、“合作性”、“综合性”和“整合性”的方向发展。辅助学习语料库的建立以用户为中心的设计策略,极大地降低了资源的浪费,将计算机网络辅助教学与传统教学方式完美融合。
  
  参考文献:
  [1]霍斯顿.应用语言学中的语料库[M].北京:世界图书出版,2006.
  [2]李杰.笔式用户界面开发研究[D].北京:中国科学院软件研究所,2004.
  [3]隋桂岚,刘励.关于大型文学语言语料库的构建[J].外语电化教学,2004,(2).
  [4]陈锡周.云南少数民族语言数据库[J].云南民族学院学报,2003,(1).
  [5]朱麟.中国英语语音模式及在教学中的应用[D].北京:中央民族大学,2007.
其他文献
日本的汽车工业已成为日本工业体系中的重要命脉。其中有代表性的丰田汽车公司,年产量为6百万辆,并已大量地打入了国际市场。在美国,中国到处都可以看到有“TOYOTA”标记的
在进行减振试验时,由于减振器的非线性因素和试验系统的惯性因素,试验曲线出现动畸变。本文建立了教学模型,编制了计算机程序,可以对示功图的各种动畸变作出解释,有助于统一
2012年是中注协实施会计师事务所执业质量检查制度改革的第二年。为深化检查制度改革,进一步贯彻系统风险检查理念,适应行业新形势和新任务的要求,中注协认真总结2011年改革
患儿女,6岁。因反复气喘3年,再发1天于1998年10月23日入院。既往有荨麻疹病史。体检:T36-8℃,P120/min,R20/min,体重20kg。双肺满布哮鸣音,心脏听诊正常。实验室检查:血红蛋白134g/L,白细胞10-6×109/L。胸部X线 Children with children,
由于先进复合材料(ACM)的出现,飞机的结构材料有了很大的变化。如果把复合材料用于飞机的主翼和机身的整体结构,则可比金属结构的重量减轻约20%,若用于舵面和机门等二级结构
新生儿尿布疹是新生儿常见的皮肤病,常由护理不当所致。患儿往往因疼痛哭闹不安,经过积极得当的治疗可使之迅速好转、痊愈,反之则可能迁延不愈,可继发感染.加重原发病情。我们于19
本文从几何原理出发,对汽车前独立悬架双横臂导向机构进行了分析研究,提出了在车轮整个缓冲行程内,导向机构各节点坐标及前轮定位等有关参数的计算方法,编制了微机程序,其计
我国出版的有关自行车设计和工艺的书籍为数不多,《手册》的出版值得珍视。本文作者以读者的身份评述了《手册》的优点和不足之处,认为《手册》有很大的实用性,特加推荐。 T
介绍了 T801型转鼓试验台的总体结构、主要部件的结构参数以及仪表检测和保护系统。 The overall structure of the T801 drum test bench, the structural parameters of t
本文根据高职院校高端技能型专门人才的培养目标,结合企业提出的"高职学生后劲不足"与学生就业"发展空间不足"的矛盾,实施了学期项目教学改革,提出了学期项目运行模式构建的