论文部分内容阅读
写作是大规模语言考试中用于衡量应试者语言知识和词语组织能力的重要途径,然而基于人工评分的方法存在以下缺点:一是耗费巨大的人力、物力、财力。二是评分的主观性强、误差大。随着自然语言处理技术的发展,其在词性标注、句法分析等方面都取得了突破性的进展,基于统计和自然语言处理技术的作文自动评分方法不断涌现。传统的作文自动评分方法从词汇、中心思想和组织结构等方面抽取特征,并采用线性回归等简单模型进行训练,其中抽取的特征按是否考虑词的含义分为非文本特征和文本特征。这种方法存在的问题是:将各类特征简单累加在一起并不一定能获得最好的效果,同时线性回归等简单模型无法很好的挖掘特征的非线性关系,并且抽取特征时很少考虑文中的语义信息。本文主要从作文用词的多样性角度进行评分,具体从模型选择和词多样性特征抽取两个方面进行研究,主要研究内容包括以下3个方面:第一,本文从词层面和句子层面构建了非文本特征,并对比随机森林回归模型和作文评分中常用模型在非文本特征上的效果。随后通过增量式特征组合的方式验证各类特征表现力并得到最优的非文本特征组合。针对非文本特征未考虑文章内容,评分信度不高且其评分机制很容易被识破和利用的问题,构建了基于LDA主题模型的文本特征,实验结果表明基于LDA的文本特征具有很好的效果。第二,为了衡量作文用词的多样性,需要尽可能准确的获取词的语义信息和词的语义相似度。本文使用了基于词向量的词表示方法,通过词向量聚类的方法将词按照语义信息进行类别划分,抽取作文在每个语义类别下的词分布情况作为作文的词多样性特征训练评分模型。针对词向量无法解决一词多义问题,将LDA主题模型和词向量方法进行融合,使用融合主题信息的词向量方法。在作文实验中使用经典的Brown词聚类方法与词向量聚类方法进行对比,实验结果表明融合主题信息的词向量方法能更准确的表示词的语义信息,在各类文本特征上取得了最好的效果。第三,本文实现了一个作文自动评分系统,使用上述的随机森林和融合主题信息的词向量方法实现系统的核心评分功能,并在此基础上加入相应的辅助功能实现一个功能完善的评分系统,其中通过对评分过程进行细化让用户对写作中的词、句子和内容相关性等各方面有充分了解,同时提供了优秀作文推荐和作文检索功能。