面向小学藏语文阅读问题生成服务系统研究

来源 :中央民族大学 | 被引量 : 0次 | 上传用户:skyzbc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏语历史发展悠久且应用广泛,是藏族人民日常生活中的主要语言,是保持民族团结和促进藏区经济发展的重要纽带。小学藏语文是藏族地区义务教育的重要课程,而藏语文阅读是小学藏语文教学的重要组成部分,通过藏语文阅读教学,可以让学生对藏族历史有更深的理解,对传承藏语言文化和科学保护藏语具有重要的价值。目前,藏语教学在师资力量、基础资料、题库储备等方面相对薄弱,相比汉语文教学,藏语文阅读材料相对不足。此外,藏语地区教师资源并不充足,造成藏语文阅读题库更新速度慢、阅读题库构建成本高、材料可选择面较窄等问题。随着人工智能技术的发展,利用计算机技术辅助藏语言教学,通过选取更大规模、更广泛的阅读材料,同时利用自然语言处理技术自动生成适合小学藏语文阅读的问题库,可以一定程度上实现小学藏语文教育的现代化。本文通过自然语言处理和信息技术,实现了小学藏语文阅读材料的扩充以及小学藏语文阅读题目自动生成系统的构建,主要工作如下:1、针对小学藏语文阅读材料不足的问题,本文利用信息检索和OCR技术获得了四川民族出版社发行的《藏语文》教材语料,爬取了云藏网站的百科语料,通过构建基于BERT预训练模型的藏语文本分类器,实现了小学藏语文阅读材料的扩充。本文将271篇阅读材料扩充到4,261篇,构建了小学藏语文阅读语料库,并对外公开(https://github.com/andongBlue/Primary-School-Tibetan-QA-Data)。其中,基于预训练模型的分类器,采用自注意力和Softmax技术,训练得到藏语文本分类器模型,对小学藏语文阅读文本的分类结果可达到97%的准确率。2、针对藏族地区教师资源不足,藏语文阅读题库构建成本高、更新速度慢等问题,本文在构建的小学藏语文阅读语料库的基础上,通过众包方式构建了小学藏语文问题-答案数据集(5,348条问答对),以此作为问答自动生成的训练语料库,将Transformer作为生成模型的基础架构,实现了基于阅读材料的问题自动生成。训练方面,在多次试验中选择训练20轮次,最终获得小学藏语文阅读问题生成模型。在BLUE-2和ROUGE-L评价指标下,实验结果分别为25.11和35.56,此结果超过了使用端到端网络的传统方法。3、搭建了小学藏语文阅读问题生成服务系统。为了更好的服务教师,降低教师的使用门槛,解决教师使用便利性以及效率的问题,本文将训练得到的问题生成模型部署到网络服务器中,并且通过网页的形式搭建系统。在系统搭建过程中,使用Python作为编程语言,用Django作为系统的框架,选择阿里云作为服务器。教师可以通过互联网访问系统,将藏语阅读材料和相关答案输入在系统中,通过模型的计算获得新生成的问题。搭建的系统通过了功能和性能测试,具有一定的稳定性。
其他文献
<正>党的十八大以来,党中央高瞻远瞩、审时度势,以前所未有的决心和力度深入推动实施创新驱动发展战略,坚持把科技创新摆在国家发展全局的核心位置,并在党的二十大报告中强调,加快实现高水平科技自立自强,强化企业科技创新主体地位。新发展格局下,加快科技创新成为实现高质量发展的必由之路。金融是现代经济的血脉,支持科技创新不仅是金融业服务实体经济的重要着力点,也是自身转型发展的必然选择。近年来,金融监管部门持
期刊
伴随5G时代的来临和物联网科技的蓬勃发展,大规模数据密集型应用迅速兴起,数据处理需求迅猛增长,但是移动设备的计算能力、电池及任务处理能力并没有跟上数据密集型应用发展的脚步,处理数据时面临着巨大的挑战。传统云计算模型存在宽带负荷高、计算资源浪费、隐私保护、延迟及能耗较大等不足,而移动边缘计算(Mobile Edge Computing,MEC)则凭借实时处理的低时延、低能耗、安全性高、协同执行等特点
学位
近年来,城市交通拥堵问题得到了广泛关注,交通治理越来越受到管理部门的重视。随着自动驾驶和智慧城市研究的发展,及时、准确的道路交通信息预测对于交通管理、交通规划和交通安全来说都至关重要。然而及时准确的道路交通信息预测面临着非常大的挑战。首先,道路交通流规律是随着时间的变化而变化的,其变化的规律不是平稳的。比如说工作日和非工作日的交通流变化规律,早高峰和晚高峰的交通流变化规律,早晚高峰与平时的交通流变
学位
“互联网+教育”的模式改变了传统教育一师一书一间教室的模式,打破了时空限制,为高质量教育的实现带来契机。但是高质量教育的实现,重点在于区域协调发展,在于学生的个性化发展。藏族地区是目前教育资源匮乏,教育质量相对落后的地区,教育模式依旧是单向的灌输式教育,导致学生学习兴趣不高,影响学生的个性化发展。其次在藏族地区,由于多种因素的影响,导致目前使用藏方言的人数正在削减;并且不同的地区使用不同的方言,阻
学位
有机无机金属卤化物钙钛矿太阳能电池(PSCs)近些年来受到太阳能电池领域研究者的广泛关注,其光电转换效率已从2009年的3.8%增加至如今的25.7%,效率发展十分迅猛,使得PSCs有望成为低成本光伏技术的典型代表。随着性能逐步提升,PSCs中的光学损失越来越成为制约器件效率的关键。本文围绕可印刷介观钙钛矿太阳能电池(p-MPSCs)中的光学调控展开研究,对其进行了光学损失分析、光学损失优化和光谱
学位
“叙事”是人们对时间的基本组织原则,而在这一原则之下,人们通过话语来完成自我的构建。在叙事的过程当中,由于人的叙述,故而进一步完成着人格的构建。在此之中,“叙事心理学”正是把人们的生活故事当做心理学的主要研究对象进行分析与讨论。舞蹈作为一种“长于抒情,拙于叙事”的艺术门类,其虽然“拙于叙事”但并非不能叙事。在人物形象塑造的方法论方面,主要以戏剧理论或影视表演理论为基础,并在此基础之上借鉴文学、心理
学位
本论文以“基于‘历史关联’的高中古诗词教学个案研究”为题目,以“历史关联”的古诗词为研究对象,阐释了“历史关联”的内涵及其在古诗词教学中的作用,通过对湖北省X中学的古诗词教学现状进行调研,分析了该校在基于“历史关联”的古诗词教学中存在的问题,并针对这些问题和成因提出了相关的教学建议,旨在让高中生在古诗词学习中能够强化“文史贯通”的意识,为诗词鉴赏提供新的角度和方法。本论文共分三章:第一章是对基于“
学位
情感计算是实现高级人机交互的核心技术之一,它随着深度学习、人工智能的高速发展,受到了广泛的关注,不断地被研究者研究。情感的表述方式多种多样,基本可以分为生理信号和非生理信号两大类。常见的非生理信号有语言、文本、面部表情、身体姿势等;生理信号主要有脑电、心电、肌电、表皮电阻、表皮电流、光电脉搏、呼吸信号等。在非生理信号中,表情是最直接的一种表达方式。在生理信号中,脑电信号与情感的联系较为紧密。关于表
学位
金课建设的提出为高校人才培养打下坚实基础,同时为实施课程思政教学改革提供了良好的基础环境。通过对通信原理课程思政实践研究现状的分析,提出金课建设背景下通信原理课程思政教学改革方案并进行改革实践,采用视频互动教学、案例教学、微课教学等多种教学形式,力求人才培养和思政教育同步推行、目标双至。
期刊
在自然语言生成任务中,词汇选择(lexical choice)是其中的一项子任务,其目的是根据上下文选择恰当的目标词表达相应的语义概念。在实际的词汇选择问题中,对于同一个语义概念,常常有多个意义相近的词可供选择,这些近义词分别在外延、内涵等方面有细微的差异,若能从多个近义词中选择出恰当的目标词则可以生动的表达相应的语义概念,进而提高自然语言生成系统的质量,提升用户的使用体验。随着科技的发展和社会的
学位