学生英译汉网上自动测评探索

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:suxinlan2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的普及和发展给语言学习和语言测试提供了前所未有的机遇和发展空间。随着客观题测试技术的日趋完善,主观题的自动测评让语言测试者备感兴趣,同时也给语言测试带来了新的挑战。学生英译汉网上自动测评研究具有很高的理论意义和实用价值。学生译文与标准译文的比对、测评是汉语语义理解和概念相似性分析研究,其理论探索有意义,技术实现也有难度。 本文研究学生英译汉网上自动测评问题,内容包括实践尝试、理论探讨、网上实现、部分标准译文自动生成四个部分。实践尝试包括字符串完全匹配、关键词匹配、词语相似度计算、同义词匹配和句式匹配等一系列有效实验,并取得了较好的效果,与人工测评的相关系数达到了0.58(一般人工评分员之间公认的相关系数为0.7~0.75)。理论探讨包括学生英译汉网上自动测评问题的本质以及与机器翻译系统、汉语主观题、标准化考试中的英译汉三种自动测评的区别。结合认知心理学分析了测评中的相似度、离散度、容纳度及有关理论和技术难点。理论模型将测评问题分解为相似度等四个子问题。网上实现基于现有中文信息处理资源,设计了测评系统流程和算法,创建了自动测评网站,完善了必要的网站结构及其功能,研究了题库结构并逐步积累题库资源,从而初步完成了测评的工程化,实施了学生英译汉的网上自动测评。实际效果表明学生英译汉网上自动测评已达到了实用要求。最后探索了利用网络资源为标准译文库自动生成和筛选源自英语名词短语的标准译文候选项,以及利用语义对候选项进行再次筛选等深层理论和应用技术问题。实验结果表明,自动语义筛选方法的正确率为84.21%,召回率为76%。实践证明词频统计和词语语义的双重筛选方法可以使自动生成的候选项基本达到标准译文数量和质量上的要求。方法论上,创新研究不是从算法比较开始,而是从学生译文分析和测评问题的本质及实践探索开始,旨在认识问题的实质及其关键。重视实践过程,数据分析及其相关理论:具有独特特点的汉语语义理论,涉及人脑学习机制的认知理论。 本文的创新点主要在于: 一、凸现本质,攻克难点。首次对学生英译汉自动测评问题进行实践探索和理论探讨,提出测评问题的本质是基于语义的自动测评。在现有中文信息处理相关理论和技术条件下,采用关键词匹配和词语语义相似度计算的混合方法实现自动测评,超越了通常单纯字符串匹配的局限性。其难点在于如何处理好相似度、离散度和容纳度三者之间的关系。给出了学生英译汉网上自动测评模型。 二、技术独特,分类处理。“词语对比分析器”首次采用词语分类对比方法,对不同词类(名词、动词、形容词和副词)采用不同的基于语义的自动评分方法,有别于现有常规的不分词类的相似度单一算法,明显提高了译文对比时的精确度,而对其它词类仍采用关键词匹配,更贴切真实地反映了学生的实际水平。此外,设计了“句式对比分析器”,采用人工设计标准译文句式模板,实现了句子层次上的全局评分,从而更客观地反映了学生的理解程度。 三、独辟蹊径,生成译文。自动筛选源自英语名词短语的部分标准译文候选项时,首次提出了在概念意义层次上对比英汉词语、筛选汉译短语的方法,从而实现自动语义筛选。将词语表达式提升到概念层次,克服单纯字串匹配所带来的弊端,试图反映学生心智上对词语的认知,从而在较高层次,即复合概念层次,而不是从单个概念上,客观地反映学生对语言的理解和掌握程度。实践证明,该方法对源自英语名词短语“N1N2”和“N1ofN2”的汉语译文的自动语义筛选,成效显著。 四、注重实用,工程实现。研制了面向实用的系统,建成了自动测评网站,实现了学生网上注册、网上选题、网上限时做题、网上提交译文、网上即时反馈和电子邮件反馈评分结果及标准译文等功能,在当前国内外尚属鲜见的创新成功尝试。
其他文献
随着全球信息化的发展,传统媒体正在向数字媒体转变。宽带网络硬环境的不断改善为传统电视媒体的数字化提供了强有力的支撑,IPTV作为电信新的业务增长点,正步入蓬勃发展的阶
随着经济和社会的的发展,货币识别技术得到广泛的用途,在社会生活中扮演越来越重要的角色。为了应对层出不穷的防伪技术和越来越先进的伪造技术,必须透彻的研究货币的特性,并
多媒体技术的飞速发展和国际互联网的普及,给人们的学习和工作带来了极大的方便,人们可以通过网络进行信息交互,共享网络资源。互联网已成为人们离不开的信息工具。但是同时
虚拟专网(VPN)技术是指在公共网络中建立专用网络,将数据通过安全的“加密管道”在公共网络中传播,可以保证数据的安全传递。而且使用VPN技术组建网络有节省成本、提供远程访
近年来,随着H.264/MPEG-4 AVC、AVS等新一代视频编码标准的制定,视频编码技术正一步步走向成熟。帧内预测技术作为混合视频编码框架中的重要组成部分,对提高视频编码效率有重
随着计算机和网络技术的不断发展,在线学习越来越成为目前国内外的研究热点,近些年涌现了一大批在线学习的网站,如Coursera, Edx和Udacity,这些网站大多要求学习者通过观看视
IPv6也被称为下一代网际协议(Next Generation Internet Protocol,IPNG)。它是网络技术史上重要的升级之一。它将慢慢取代IPv4成为因特网络的基础设施,并且将对网络产生积极
数字音像内容集成管理平台(NNM管理系统)是基于C/S模式的、在内容运营商系统中实现对音像内容管理、查询和维护的平台。对于运营商来说,它是对分布式资源网络中所拥有的音像
目前我国正在处于信息化建设的时代,各部门和各单位都组建了各自的网络系统,这些网络主要包括无线传感器网、以太网、自组网等。然而这些异构网络系统种类繁多、接口各异,因
文景转换系统,主要分成三个模块:抽取自然语言脚本模块、自然语言脚本生成动画脚本模块、动画生成模块。本文是该项目从自然语言到动画的中间过渡模块。本文的研究任务是从自