论文部分内容阅读
练习是教材编著的重要组成要素之一。练习的重要地位可以从两方面阐述:其一,从心理学角度看,练习是把短时记忆转化为长时记忆的手段;其二,从语言学习理论的角度看,练习是把掌握的知识转化为语言交际能力的重要途径。练习对教材编著如此重要,那么对练习的内容、类型、层次、数量、强度、密度、彼此之间关系、涉及的语言技能要点以及语言训练模型等等,进行深入的研究就很有必要。而研究练习的前提是要有资源即大量的习题,所以构建习题库是相当有必要的。
题库是“按照一定的教育测量理论,在计算机系统中实现的某个学科习题的集合”,它严格遵循教育测量理论,它是在精确的教学模型的基础上建立起来的教育测量工具。一个高质量的习题库应该是由分类科学、质量高、大量的习题构成的,为了确保习题质量、大量减轻教材编著人员和教师等编写练习负担,本文实现了一个对外汉语习题库系统,本文的研究重点是在这个习题库基础之上,对对外汉语练习题进行属性标注并且对标注好的练习题进行分析,这将有利于练习编著人员的练习编写和教师的教学。
本文构建了一个对外汉语练习题库,数据来源是《博雅汉语》和《新实用汉语课本》2套教材19本书上所有的练习,总共有3252个大题,11668道小题,在确定了练习题的存储结构后本文把练习题已经全部导入了数据库,在对对外汉语习题相关论文的研究后,本文提取了练习题一些重要的属性,包括语言要素、技能、难度等级、题型和练习题主题,在此基础之上,构建了练习题标注体系,并且在人工标注一部分习题属性后实现了练习题属性自动标注器。
练习题属性自动标注器采用了文本分类中的方法,首先对练习题的内容进行分词,然后通过DF-CHI结合的方法对每个练习题主题类别进行特征选择,然后对每个主题类别的特征计算权重,最后构建分类器实现待分类的练习题的主题分类。
最后,本文设计了练习题库检索系统并在习题库的基础上进行了统计和分析,统计主要从题量、题型、语言要素、技能、教材难度和主题几个方面来考虑,通过对统计结果的分析得出了一些有效的结论。