基于神经网络的开放式口语评分系统研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:siyu321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着教育信息化水平的不断提高,计算机辅助语言学习(CALL)系统在语言教学中的应用也变得更加广泛。在国内大学的英语口语考试中,教师需要对大量考生的口语录音进行人工批改,这是一项重复且消耗时间的工作。利用CALL系统实现对口语录音的自动化批改将能减轻教师的工作负担。目前这样的系统已经成功实现了对朗读型口语题的自动批改。然而,针对开放式口语题型进行自动化批改仍然是待突破的研究重点。因此,设计并实现一个针对开放式口语的智能评分系统具有重要的研究意义及应用价值。本文结合深度学习技术和面向对象设计思想对评分系统进行了详细设计与实现。系统将通过两个评分模型分别对口语语音和口语内容进行单独评分,并将两个评分结果相加后作为最终得分,其中口语内容是通过外部语音识别引擎对录音进行文本转录得到的。本文基于不同的神经网络构建了两类评分模型。在第一类模型中,语音评分模型和文本评分模型均使用BP神经网络来构建,这类模型的输入特征需要人工进行选择。本文共提取了七类特征:发音质量、流利度、内容丰富度、主题相关度、语法、词汇丰富度、句子结构。在第二类模型中,两个评分模型均使用一维CNN和LSTM网络来构建,这类“端到端”的评分模型无需进行特征工程,本文将口语录音和口语内容分别转化为MFCC向量和词嵌入向量来作为评分模型的输入。最后,本文使用北京邮电大学情景英语考试现场采集的650份口语录音及其对应的人工评分数据对模型进行了训练与测试。实验结果表明,在训练数据集较小的情况下,BP网络模型获得了更好的综合评分性能。
其他文献
改革开放以来,我国经济飞速发展,人民收入水平与日俱增,城市化水平节节攀升。但在经济景象一片欣欣向荣的背后,各地政府在发展中均面临城镇建设用地不足的困境,快速的城镇化
汽车作为主要交通工具,使得人们出行舒适便捷的同时也带来了交通安全隐患。车辆在行驶过程中,由于驾驶员的可视范围受限、交通环境复杂以及驾驶员的技术生疏或处于疲劳状态导致车辆在驾驶员无意识状态下偏离正在行驶的车道,引发擦碰事故,不仅带来时间和财产的损失,导致局部区域交通拥堵,更严重的可能造成人身安全的损伤。车道偏离预警系统(Lane Departure Warning Systems,LDWS)作为主动
视频由于内容上的生动、直观和多样性,逐渐成为娱乐和社交活动的重要组成部分,但也导致了视频规模的急剧增加。如何有效地对海量视频数据进行分类和检索成为了当前计算机视觉和信息检索领域的研究热点之一。由于视频内容和结构的复杂性,使得视频时空特征表示的有效性成为了一个难点,本文对视频分类和视频检索关键技术进行了较为深入的研究,主要工作如下:1.设计并实现了一种基于多级池化的伪3D卷积神经网络的视频表示算法。
随着传感器技术的不断完善。通过传感器收集的生物信号逐渐走进研究人员的视野,由于肌电图信号的便于观察且具有较高的实时性,受到大量科研人员的关注。肌电图信号常用来监测和评估目标肌群的状态,其中肌肉疲劳检测在康复医学领域被广泛应用。其主要目的通过传感器收集肌电图信号数据进行分析,这有助于阐明肌肉疲劳的病理生理机制,并针对患者不同病症量身定制治疗方法。表面肌电图信号(s EMG)以其便于采集,受到广大科研
数据分析中,从网络中进行概念认知学习是网络背景下的机器学习和人工智能领域的重要问题。在之前的研究中,人们发现许多数据背后都有其网络结构和概念背景,于是将二者结合,研究基于网络形式背景的概念认知学习,有其重要的理论意义和应用价值。本文首先提出了网络形式背景的概念,将复杂网络分析中反映网络结构的矩阵与形式背景相结合,提出网络形式背景。这样可以将复杂网络分析和形式概念分析的研究统一到一个框架中,并使得以
本世纪初以来,愈来愈多的新生代农民工涌入城市务工,他们已渐渐成为城市建设的主力大军,这也使得社会越来越关注新生代农民工。如何管理新生代农民工成为现代企业可持续发展
目前,全球范围内建筑业面临高耗能、高污染的问题,我国尤为严重,建筑业能耗高、全球变暖、雾霾严重的问题限制着我国经济的发展、社会的进步,基于此,被动房这一新型节能建筑应运而生。被动房是目前兼具超低能耗性能以及高舒适度居住体验于一体的科技节能型建筑,大力开发被动房是我国降低建筑能耗、实现节能减排战略目标的重要途径之一。被动房在我国发展起步相对较晚,各地区的发展不一。尽管政府方在积极推广绿色建筑、节能建
随着后金融时代国民经济的逐渐发展,技术创新已然成为发展我国经济的核心因素。其中,作为可以进行自主创新也可以进行创新成果转化的主体,企业凭借其独特的天然的产业化优势,成为了研究创新绩效的主要对象。而大中型工业企业又是我国国民经济支持的重要支柱,从一定程度上来说,其大量的科技创新活动的创新效益水平走势能够反映全国工业企业创新活动效益水平的发展趋势。因此,如何看待我国大中型工业企业创新要素资源联动效率的
随着移动通信技术的快速发展和移动电话的普及,运营商短消息业务己经具有十分庞大的业务量。但是,与此同时不良短信的泛滥也日趋严重,由此而导致的居民财产损失、个人隐私泄露等事件时有发生。因此对不良短信进行有效治理具有重要意义。针对短信文本特性稀疏、噪声大的特点,本文提出基于深度学习的DBiGRU-Atten模型对不良短信进行识别。DBiGRU-Atten模型能够通过深度神经网络自动提取短信文本的高阶特征
云计算是一种新型的计算存储方式,用户不需要掌握专业的技能,只要按照自己的需求付费就可以享受便捷的网络服务。我们在使用云服务时,需要将数据上传到云服务器。在这个过程中,我们不可避免地面临着数据安全的挑战,如何保证云环境下数据的隐私安全成为了亟待解决的问题。云环境下数据安全隐私保护主要分为两方面,一方面对外保护数据的隐私;另一方面对内保证数据的完整。身份认证是云服务安全的第一道防线,可以有效地防止非法