英文背诵题及复述题自动评测技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ysufeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展,计算机辅助学习(CALL,Computer Assisted Language Learning)系统日趋智能化。CALL系统能准确、客观即时的反馈考生发音情况,极大的促进了考生学习效率和教师阅卷的客观程度。目前CALL系统的口语评测均是依赖文本(text-dependent)的评测(如朗读),且技术日趋成熟。例如在中文普通话水平考试(PSC,Putonghua Shuiping Ceshi)前三题(单字朗读、单词朗读、短文朗读)上,计算机评分性能甚至超过了从事多年评分工作的专业评分员的评分性能。 背诵和复述是重要的英语学习方法,能比朗读更好的反映发音人的英语口语水平和表达能力。对于背诵题而言,虽然考生必须按照所给文本进行背诵,但由于看不见原文,导致实际发音和文本存在较大的不一致,且许多考生不能完成背诵,因此,可以看成是介于朗读题和复述题之间的一种题型;对于复述题而言,该题型是文本无关(text-independent)的,考生可以完全用自己的语言对文本进行描述。目前的CALL系统并不能对这种不严格依赖文本的题型进行较好的评测,从而极大的限制了CALL系统全面的推广和使用。 因此,本文在朗读题评分系统的工作上,将工作向文本无关的方向进行延伸。在背诵题方面,抓住背诵的特点,采用句子并联网络,对考生的语料进行识别和处理。这样既避免了引入更多的混淆,又能应对说话人漏背、重复及未背完的情况,取得了专家性能的90%,达到实用水平。在复述题任务上,结合了语音识别、自然语言处理等技术,并根据复述题特点进行了一系列的改进,取得了专家评分性能的84%,超过了教师在高强度下批量阅卷的评分性能,能辅助老师进行更科学客观的评分。 本文的实验结果证实了文本无关评分的可行性,为以后深入的研究奠定了基础。 文章结构如下: 第一章简单介绍了语音评测的发展背景与现状,重点阐述了语音评测的原理、系统构成、以及所依靠的语音识别技术基础。 第二章主要介绍语音评测系统具体实现的方法、流程,并作相应的分析。 第三章对背诵题题型的评测进行研究,根据其题型特点,主要提出了较朗读题稍灵活、但限制性很强的“句子并联”型识别网络,取得了较好的效果。 第四章首先搭建了复述题评分流程。并针对复述题无需按原文复述、考试现场录音质量低等难点,通过借助朗读题数据的声学模型自适应处理、基于复述原文的通用语言模型裁剪、基于识别输出词图的评分特征提取等方法,改进了系统评分性能。 最后将对全文进行总结,并指出将来的可能的改进方法。
其他文献
正交频分复用(OFDM)技术是一种并行的多载波传输方案,具有易于实现、频谱利用率高、抗多径衰落能力强、能有效抑制符号间干扰(ISI)和载波间干扰(ICI)等特性,已成功应用于多种
无线传感器网络中节点数量庞大、单个节点资源有限、网络传输数据量大,其路由协议的性能直接影响着网络的工作效率和生存周期,所以针对无线传感器网络路由协议设计的主要目标
随着信息通信技术的快速发展,尤其是IP技术的不断发展以及国家信息化战略大力的推进,IPTV机顶盒应运而生。IPTV机顶盒是嵌入式系统,包括硬件和软件部分,而嵌入式浏览器已经成
扩频通信不仅具有抗干扰,抗衰落以及抗侦察等特点,并且可以实现码分多址。1993年7月高通公司提出的IS95标准在第二代移动通信系统的应用中取得巨大成功。经过十几年的发展,目
近年来,随着无线电监测网的逐步发展,无线电监测设备也逐渐由本地大型固定监测方式转向机动灵活的小型化监测设备与组网模式。多台室外小型站通过联网方式构成网格式监测网,
软件无线电(software Defined Radio)是无线通信系统收发信机的发展方向,它使得通信系统的设计者可以将主要精力集中到收发机的数字处理上,而不必过多关注电路实现。在进行数
近年来,随着生物识别技术的兴起,虹膜识别技术被日益关注。由于虹膜识别技术对个体识别具有高度的可靠性,已成为目前生物识别中最有发展前景的识别技术之一。与其它生物识别
近年来,射击训练系统的开发成为一个研究热点。传统的射击训练系统成本较高,而且每套系统只能供单个人训练。本文设计了一种应用于警察和特种部队的模拟射击训练系统,可供多
雷达微多普勒效应是由学者Victor C.Chen提出的一个较新的理论体系,是基于物体微动模型发展起来的。自从雷达目标微多普勒现象被发现,目标微动特性在雷达目标探测与识别中受
为了适应搭载合成孔径雷达的各种运动平台的工程应用,以及气流、引力以及机械操作等误差因素的影响,用于复杂轨迹条件下的SAR运动补偿算法亟待研究发展。本文以复杂运动平台