个性化英语学习系统中的关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhuliangmike
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
熟练的掌握英语,已经成为了现代人的必备素质之一。英语学习的过程是一个整合式的学习过程,包括了听、说、读、写等部分,而各个部分之间是相互关联的,正因为英语学习的此种特性,也对英语辅助学习系统提出了需求:如何构建一个多功能融合的英语学习环境,以达到方便用户学习英语的目的。与此同时,随着互联网的不断发展,英语学习资料数量不断丰富,如何帮助用户从海量的资料中找到适合自己的英语学习资源就变得十分重要了,这直接影响用户的学习时间成本和学习兴趣。为此本文针对英语学习中面临的上述问题,综合利用自然语言处理,信息检索,机器学习等理论知识,以满足在构建英语学习系统中面临的资源的个性化组织和查找的需求。本文的主要研究内容包括以下几个方面:第一,为了对资源进行有效组织,从而为分析用户英语水平提供数据支持,本文提出了面向英文句子阅读难易度的分类方法。在具体方法上,采用了集成学习框架(ensemble learning framework)训练多个基于不同特征空间(语法特征,一元语言模型,非文本特征)的机器学习模型,以提升分类效果。并采取准确率,召回率,F值等对算法的有效性进行论证分析,最后得到了一个在实践中有效的难易度判别模型。第二,为了实现根据用户的英语水平差异进行资源组织的目标,本文提出了基于多相似度的文本检索排序模型,以方便用户准确迅速地找到与之难度匹配的文本。本文主要利用用户建模技术,在英文句子阅读难易度判别的基础上,根据用户历史信息针对用户英语水平进行分析建模,并结合查询项与文档之间文本的相似度度量方式,设计了融合两个相似度的排序模型。第三,本文将上述算法融合在本地检索框架下,建立了动态的英语资源检索系统,并对英语资源的获取和评价,索引文件的构建和快速检索等问题提出了系统的解决方法。同时,为了解决英语学习中面临的单词背诵,听力练习等需求,还在系统中引入了词表的阅览和听力试听的功能。最终,为用户构建了一个多功能融合的个性化英语学习环境。
其他文献
在现实世界中,万事万物都有着其特征,这样的特征或多或少、或重要或不重要。人们通过事物的特征可以确定其所属分类,但是当事物的特征都很多时,如果人们依靠传统的方法对事物进行
自20世纪70年代的集散控制系统的出现,传统的工业自动化控制系统出现了结构性的变革,控制系统的网络化成为了新的趋势。以数字串行通信为代表的现场总线标准成为20世纪末工业
随着仿真模型技术的广泛应用,如何提高复杂仿真模型系统的开发效率和降低开发成本问题变得越来越重要。由于系统的复杂性,难于直接开发出满足需求的模型,需要将其分解为子系统,针
大规模函数优化问题有着广阔的应用背景,很多实际应用中的问题都可以抽象成此数学模型解决。进化算法是目前被普遍公认的一种求解函数优化问题行之有效的方法,以其实现简单、求
随着数码产品的普及,人们现在可以随时记录现实生活中的各种场景信息,而普通的数码产品由于受其自身硬件设备的限制,一般无法完全把场景的所有信息记录下来。比如,一个真实场
马铃薯作为我国第四大主粮,对其外部缺陷的检测直接影响到我国马铃薯商品化和深加工进程。由于目前国内大多基于特定环境、特定光照下进行检测,这并不能满足实际环境检测要求。因此,本文提出在开放的自然光环境下对马铃薯主要外部缺陷绿皮、发芽、病斑等的无损检测方法进行研究,这对马铃薯进行深加工和商品化具有重大意义。本文首先针对自然光环境下马铃薯图像的分割方法进行研究,提出一种新的方法分割出马铃薯目标区域。主要先
随着虚拟现实技术的发展,通过这种技术创建一个消防仿真训练系统成为了当今消防训练的趋势。在消防仿真中,火焰的效果直接反应了当前虚拟环境中火灾的发生情况,因此火焰特效是这
体数据在科学模拟、医学影像、石油勘探等领域普遍存在,体数据的可视化也一直是科学计算可视化领域的研究热点。直接体绘制方法因能全面展示体数据的信息、揭示内部特征而备受
近年来,随着科学技术的进步,数据的处理和采集技术也得到突飞猛进的发展,人们对于不确定性数据的关注也越来越多,在不确定性数据中包含离散的不确定和连续的不确定两种类型的数据
随着计算机技术的发展和网络时代的来临,应用系统的更新换代速度逐渐加快,数据作为应用系统的核心,也同样面临着在不同系统和环境下的迁移问题。数据迁移的需求大多存在于关系数