面向Web的对外汉语练习题库设计

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:cairaymond
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
练习是教材编著的重要组成要素之一。练习的重要地位可以从两方面阐述:其一,从心理学角度看,练习是把短时记忆转化为长时记忆的手段;其二,从语言学习理论的角度看,练习是把掌握的知识转化为语言交际能力的重要途径。练习对教材编著如此重要,那么对练习的内容、类型、层次、数量、强度、密度、彼此之间关系、涉及的语言技能要点以及语言训练模型等等,进行深入的研究就很有必要。而研究练习的前提是要有资源即大量的习题,所以构建习题库是相当有必要的。   题库是“按照一定的教育测量理论,在计算机系统中实现的某个学科习题的集合”,它严格遵循教育测量理论,它是在精确的教学模型的基础上建立起来的教育测量工具。一个高质量的习题库应该是由分类科学、质量高、大量的习题构成的,为了确保习题质量、大量减轻教材编著人员和教师等编写练习负担,本文实现了一个对外汉语习题库系统,本文的研究重点是在这个习题库基础之上,对对外汉语练习题进行属性标注并且对标注好的练习题进行分析,这将有利于练习编著人员的练习编写和教师的教学。   本文构建了一个对外汉语练习题库,数据来源是《博雅汉语》和《新实用汉语课本》2套教材19本书上所有的练习,总共有3252个大题,11668道小题,在确定了练习题的存储结构后本文把练习题已经全部导入了数据库,在对对外汉语习题相关论文的研究后,本文提取了练习题一些重要的属性,包括语言要素、技能、难度等级、题型和练习题主题,在此基础之上,构建了练习题标注体系,并且在人工标注一部分习题属性后实现了练习题属性自动标注器。   练习题属性自动标注器采用了文本分类中的方法,首先对练习题的内容进行分词,然后通过DF-CHI结合的方法对每个练习题主题类别进行特征选择,然后对每个主题类别的特征计算权重,最后构建分类器实现待分类的练习题的主题分类。   最后,本文设计了练习题库检索系统并在习题库的基础上进行了统计和分析,统计主要从题量、题型、语言要素、技能、教材难度和主题几个方面来考虑,通过对统计结果的分析得出了一些有效的结论。
其他文献
移动网络用户的信息存储是在移动环境下对用户进行快速定位的关键。在移动环境下,对于一次通信过程,系统需要查找并定位相应的接受方的信息,而这个过程往往是要求低延迟和快
命名实体识别作为序列标注任务之一,与分词、词性标注等都是中文自然语言处理的基本任务。多个自然语言处理的应用,如信息抽取、信息检索、机器翻译和问答系统等都依赖命名实体
现代石油产业中,石油储量的预测是制定能源规划的重要组成部分。通过石油储量预测,可以制定最优的石油战略、安排石油建设以及优化配置等等。预测结果的合理性主要取决于预测方
随着计算机软硬件技术的发展使得计算机的应用领域越来越广泛,许多公司都建立了自己的内部网络用来提高办公效率,降低运营成本,这就使得通过网络传输的数据不断增加,网络在为企业
负选择算法是人工免疫的分支,对自我和非我细胞区分过程进行计算模拟,主要是模拟胸腺中T细胞的成熟过程。由于计算机安全领域的核心问题是识别异常状态,这与生物免疫系统所遇
随着分布式计算环境中,网络上的节点向着智能化和服务性方向发展,主体(Agent)和多主体系统(Multi-AgentSystem,MAS)成为支持开放的、可重构和可伸缩的新型分布式协同计算的重要
在感知真实世界时,人眼通过在视野内场景的各个区域问跳转以移动注意焦点、获取图像中的信息。视觉搜索是人最常发生的视觉行为之一,相较于一般的自由观看任务,视觉搜索中的眼动
针对现行石油勘探开发关系数据模型的缺点,深入研究了国际标准POSC数据模型。分析了Epicentre V3.0的高层模型、特点,并总结出Epicentre对中国油田信息标准化的指导意义。在厘
在油田勘探中,声波测井数据常用于计算储层孔隙度、地层压力、油藏储量等工作。井眼的极端扩径情况对声波测井数据会造成影响,消除这种影响对于油田勘探至关重要。传统的基于模
地震反演技术是伴随着地震技术在油田勘探与开发中的不断深入应用而发展起来的,是目前储层预测与描述的最有效工具,但由于其固有存在的多解性,不深入分析进行盲目应用具有一定的