论文部分内容阅读
熟练的掌握英语,已经成为了现代人的必备素质之一。英语学习的过程是一个整合式的学习过程,包括了听、说、读、写等部分,而各个部分之间是相互关联的,正因为英语学习的此种特性,也对英语辅助学习系统提出了需求:如何构建一个多功能融合的英语学习环境,以达到方便用户学习英语的目的。与此同时,随着互联网的不断发展,英语学习资料数量不断丰富,如何帮助用户从海量的资料中找到适合自己的英语学习资源就变得十分重要了,这直接影响用户的学习时间成本和学习兴趣。为此本文针对英语学习中面临的上述问题,综合利用自然语言处理,信息检索,机器学习等理论知识,以满足在构建英语学习系统中面临的资源的个性化组织和查找的需求。本文的主要研究内容包括以下几个方面:第一,为了对资源进行有效组织,从而为分析用户英语水平提供数据支持,本文提出了面向英文句子阅读难易度的分类方法。在具体方法上,采用了集成学习框架(ensemble learning framework)训练多个基于不同特征空间(语法特征,一元语言模型,非文本特征)的机器学习模型,以提升分类效果。并采取准确率,召回率,F值等对算法的有效性进行论证分析,最后得到了一个在实践中有效的难易度判别模型。第二,为了实现根据用户的英语水平差异进行资源组织的目标,本文提出了基于多相似度的文本检索排序模型,以方便用户准确迅速地找到与之难度匹配的文本。本文主要利用用户建模技术,在英文句子阅读难易度判别的基础上,根据用户历史信息针对用户英语水平进行分析建模,并结合查询项与文档之间文本的相似度度量方式,设计了融合两个相似度的排序模型。第三,本文将上述算法融合在本地检索框架下,建立了动态的英语资源检索系统,并对英语资源的获取和评价,索引文件的构建和快速检索等问题提出了系统的解决方法。同时,为了解决英语学习中面临的单词背诵,听力练习等需求,还在系统中引入了词表的阅览和听力试听的功能。最终,为用户构建了一个多功能融合的个性化英语学习环境。