智能手机如何评估和预测大学生学业成绩

来源 :中国教育信息化·高教职教 | 被引量 : 0次 | 上传用户:qwfyhwl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:Rui Wang等学者创造性地提出了智能GPA研究,发现了GPA和智能手机传感数据自动推断的一些行为之间有一些显著的关系。提出了一些新的自动检测方法来评估学生的学习和社会行为,包括聚会的情况和时间、学习时间和学习专注度。智能GPA研究深入分析了学习表现,并提出了每个学生数据流时间序列分析,创造性地使用行为斜率和行为断点来捕捉变化行为,以更好地了解成绩高和成绩低的学生之间的个人差异。此外,还提出了一个简单的预测模型,采用线性回归和Lasso正规化来预测成绩。研究发现学生的谈话持续时间的改变、学习的持续时间、责任心、积极的情绪水平和变化、压力的变化是显著的学习成绩预测因子。本研究以一种全新的形式建设精细化的验证预测模型,从多种属性方面捕捉、量化学生的行为变化,进而引发新的提高学习成绩的潜力干预措施,这对高校学业成绩的评估而言具有创新性的意义,开启了应用新的干预措施来提高学业成绩的新时代。
  关键词:智能GPA;行为斜率;行为断点;线性回归;Lasso正规化
  中图分类号:G40-058.1 文献标志码:A 文章编号:1673-8454(2016)23-0006-09
  大学生活是复杂的。除了课程学习,还有丰富的课外活动、繁忙的社交生活、因财务问题要去兼职工作、融入校园(大一新生)、与朋友和家人打交道等各种社会行为占用学生的时间与精力。因此,学生要在这些长期的工作消耗中努力保持身体的活跃和精神的健康,并在保持优异的学习成绩以及其他时间占用和能量需求之间寻求平衡。总之,要想在教育环境中持续保持胜利的姿态并不是件容易的事情。
  提到“學习表现”时,我们通常将其与学生累积的平均分数(GPA)相联系,即对学生在作业、测验、考试结果,期中考试、期末考试和他们在学习过程中累积的学业成绩进行连续性评价。以往的研究也发现学习表现与学生的求知欲和能力(例如用IQ来衡量)、学习动机与激励、教育环境、健康、之前的测试成绩(例如SAT),以及人格特质(例如认真度)有关。然而,为什么拥有相似学术能力的学生有的成绩会更好有的会更差一些呢?看起来学生日常行为模式(例如学习习惯、课堂出勤率、时间管理、睡眠模式、派对行为)显著影响学生学业成绩。这便引发了如下几个问题:同一所大学里,成绩好的学生(例如GPA≥3.5)和成绩差的学生(如GPA≤3)在行为模式上是否有明显的差异;如果这样的行为差异存在,我们是否可以使用这些相关性作为预测学术表现的基础;不同的心理特征,如人格、心理健康、情感等,是如何影响成绩的。
  在计算机科学界,先前已做了许多使用各种机器学习模型的尝试,想要通过学生的自我报告数据和学习行为来预测成绩。然而只有很少的研究关注学生的学习表现与感知行为之间的关系。据我们所知还没有使用智能手机被动传感器数据来预测学生成绩的先例。
  来自德克萨斯大学达特茅斯学院的几位学者Rui Wang、Gabriella Harari、Peilin Hao、Xia Zhou和Andrew T. Campbell提出一种新的方法,即用智能手机的被动检测来自动推断学生学习行为(即学习时间和专注力)和社会行为(即聚会),使用不显眼的纵向的学生的生活方式来预测学术表现,富有创新意义。本文就是对Rui Wang、Gabriella Harari、Peilin Hao、Xia Zhou和Andrew T. Campbell几位学者所做研究的介绍。
  一、先前的研究
  在教育和心理学领域,很多研究都注重大学生学习成绩的预测算法。
  (一)人格
  采用五大人格框架研究学习成绩和人格倾向间的关系,五大人格框架包括五大特质——外向、亲和力、尽责、神经敏感、开放。对学术表现与人的性格分析研究表明,学生的学习表现与亲和力、尽责性和开放性有关。然而,也有一些研究发现外向性和神经敏感与成绩呈负相关。一些研究人员认为,人格特质差异会影响学业成绩,例如通过修复神经质的行为、提高尽责性提高学业成绩。
  (二)体力活动
  大多数学业成绩和体育活动研究倾向认为,在中等强度的体力活动中健康达标的学生平均成绩较高。然而,一个健康行为的大型研究对40所美国高校学生调查发现超过一半的学生(58%)不符合公共健康部门发布的中度强度的活动标准。另一个基于自我报告的研究发现体力活动与学生平均成绩不相关。然而,这项研究主要集中于健康科学专业的研究生,这些学生的身体素质符合或超过了成人推荐的水平,这表明研究结果可能无法推广到其他学生群体。我们所知道的只有很少一些研究已经发现了学习成绩与基于传感器的身体活动测量的关系。一项研究除了自我报告外,利用传感器测量学生的体力活动,发现身体活动的变化与GPA相关。具体而言,总步数与GPA的提高相关,而中度体力活动与GPA 降低相关。学生生活研究利用学生的智能手机的数据加速度测量学生体力活动,发现较低的整体GPA与更大的活动耐力平均水平和变化度有关。
  (三)社交
  社交相关的行为(例如融入交谈的持续时间或频率、聚会、独处时间或与其他人相处时间)很难研究,这导致了在社交研究中有各种不同方式。例如,一个高校成绩预测算子元分析发现,社会参与(例如社会整合、参与校园活动)高的大学生平均成绩也高。不过晚上的活动(如聚会、电影等社会活动)与较差的学习成绩相关。另外,社会支持与大学新生较高的学习成绩相关。学生生活研究通过智能手机的麦克风收集的音频数据推断学生的社会性,它显示了一个学期里,更大的会话持续时间与较高的GPA相关。
  (四)睡眠
  大多数的学习成绩和睡眠模式研究似乎表明,有良好睡眠习惯的学生平均成绩较高。然而,一项对40所美国高校学生健康行为的研究发现,只有近1/4的学生(24%)符合公众睡眠建议标准。此外,一些研究成绩与睡眠时间关系的研究发现了学生自我报告的睡眠时间和学生的成绩之间呈负相关关系。然而,其他研究发现成绩(即累积GPA)和总睡眠持续时间的二次式关系,太少或太多的睡眠与成绩差是相关的。其他研究发现起床和睡觉时间是影响成绩重要的因素,晚睡晚起会导致成绩较差。此外,睡眠行为的变化(例如入睡时间、起床时间、总睡眠时间)与成绩相关,这样大的变化会导致成绩下滑。   (五)上课出勤与学习
  在一般情况下,对学生行为的元分析发现相关学术技能(例如学习技能和习惯)与高的GPA相关。学术行为研究也发现旷课和班级出勤也可以预测学术表现,例如按时上课的学生比不经常上课的学生学习表现更佳。例如一项元分析研究分析了上课出勤和成绩的关系,发现出勤率是与大学生班级的成绩、个人平均成绩密切相关的因素。然而,学生生活背景的研究却发现课堂出勤率与学业表现无相关性。
  (六)情感
  相对较少的研究关注学业成绩和积极情感之间的关系。那些专注于情感的研究发现正面的影响与分数升高和平均成绩相关,在下半学年的负面影响与低成绩和GPA相关。与之相反,学术表现与学生的压力之间的关系得到了更多的关注。现有的研究表明,中度的压力与学生的平均成绩减少相关,在学期结束时的压力与较低的GPA是相关的。以前的研究发现压力和成绩之间的曲线关系,太小或太多的压力都与较差的成绩表现相关。
  (七)成绩预测
  先前针对成绩预测的研究使用了一个神经网络模型,通过分级考试成绩来预测学生的成绩。利用判别函数将种种数据录入,来预测学生学业成就,提出了一个回归模型通过统计信息和导师记录预测学生的学习表现。电子学习系统应用网络挖掘预测学生的期末考试成绩。有人提出了一种利用多实例学习在电子学习环境下对学生成绩进行预测的方法,最近的工作显示他们可以使用纵向数据,如用以前的测试成绩和课程历史记录预测出一个学生有可能出现成绩下滑的危险。
  总体而言,现有的研究趋向于关注学生人格特质(例如外向性、责任心)、生活方式(例如体育活动、社交、睡眠)和精神状态(如压力、情绪)对他们的课程成绩或GPA是否有影响。现有的研究發现主要是基于学生的自我报告(例如询问身体活动或睡眠倾向的一次性调查),这可能会导致一系列的限制。例如自我报告的数据有明显的弊端(如被破坏)、耗费时间、回忆偏见、记忆的局限性,以及社会理想的顺从。
  二、智能手机预测学生成绩的创新性
  首先,用智能手机的被动检测来自动推断学习(即学习时间和专注力)和社会行为(即聚会)的方法是一次全新的尝试。其次,使用时间序列分析和学生行为状态的分析,寻找什么行为显著影响大学生平均成绩。再次,为了理解学生在行为方面的变化,提出2个新的行为指标:①行为变化,该指标捕捉行为变化的方向(例如课堂出勤率的增加或减少)和行为变化的范围(例如急剧变化或逐渐变化);②行为断点,捕捉一个学生的行为模式显示一个定向的变化(如出勤率增加或减少的点)的特定点。学生的行为数据流时间序列分析和这些变化的指标用于输入到学习成绩的相关分析和预测中。最后,首次提出了一个预测模型,可以使用智能手机上的自动行为感知数据预先预测学生的平均成绩,即使用Lasso(最小绝对收缩和选择算子)线性回归模型作为预测模型。预测模型表明,成绩更好的学生是更有责任心、多学习、体验积极的情绪,但在期中考试后积极的情绪有一个下降点,随着学期的进展,压力逐渐减少,他们也是晚上社交不那么频繁的学生。预测的平均成绩与真实现象密切有关,与之相关的r=0.81,p<0.001, 平均绝对误差(MAE)为0.179,R2= 0.559,衡量了一个模型的拟合优度,并指出该模型解释了56%的学生平均成绩的变化。这项研究没有使用任何之前传统的用于学术评价的数据,如智商和标准化的测试结果(例如SAT分数)。因此,该工作打开了利用智能手机的被动遥感数据来预测学习成绩的大门。
  三、学术成绩数据集
  Rui Wang等使用学生生活数据集的一个子集来分析和预测学业成绩。学生生活数据集是一个大的、纵向的公开数据集。数据集是对30名大学生和18名研究生在2013年春季进行为期10周的调查数据。由于研究生不考察GPA,因此,仅选取了30名大学生的数据集。每个学生每学期在达特茅斯大学上3门课。该数据集包括53 GB以上的来自智能手机的连续感知数据,包括:①目标检测数据:睡眠(睡觉时间、睡眠持续时间、醒来)、面对面交谈时间、面对面交谈的频率和身体活动(固定、行走、跑动);②位置数据:位置、室内/室外活动距离覆盖;③其他手机数据:光、蓝牙、音频、Wi-Fi、屏幕锁定/解锁、手机充电和应用程序使用。这个数据集还包括32000份日报告,报告覆盖了情感、压力、运动、情绪、孤独感、社会和学习空间;前后期调查包括PHQ9抑郁筛查表(PHQ9 depression scale)、UCLA孤独量表(UCLA loneliness scale)、正面和消极情感量表(PANAS)、感知压力量表(PSS)、五大人格框架(Big five personality)、繁荣量表(Flourishing scale)、匹兹堡睡眠质量指数(Pittsburgh sleep quality index)。最后,该数据集包括学术评估数据,如班级信息、最后期限、学业成绩(即分数、学期平均成绩、累计平均成绩)、课堂出勤率(从手机定位数据获得),和学生就餐数据包括时间、地点、费用。
  表1总结了研究人员从学生生活数据中获得的自动传感数据和EMA数据。自动传感数据捕捉日常行为。EMA数据捕捉积极的影响和压力水平。表2总结了使用心理调查的前和后数据。
  四、评估学习和社会行为
  学生生活数据集提供了大量的低水平行为,如体力活动、睡眠时间和基于面对面会话的社会性数据,但没有提供有可能影响学业成绩的与学习和社会行为相关的更高层次的数据。研究人员为行为空间分配意义或语义,融合多元感知流和行为空间,提取高水平的行为,如学习(学习时间和专注度)和社会行为(例如派对),以更好地理解学习和社会行为。
  (一)行为空间
  学生生活数据集有两种类型的定位数据——GPS定位数据和Wi-Fi位置。Wi-Fi位置是根据使用Wi-Fi网络扫描,指示了Wi-Fi接入点(APs)来确定。APs然后映射到特定的建筑物或建筑区域(如图书馆)。每一个校园建筑都被赋予了具有语义意义的标签,如研究领域(图书馆、学生学习的咖啡店)、希腊的住宅、教室、健身房。这些标签提示学生的相关行为。重要的是,研究人员将一些属性与行为空间关联起来,赋予他们更多的情境意思,具体地说有:①停留时间:学生在这些地点的时间---学习区域,宿舍,聚会或社交空间;②活动:学生在特定的领域时,有固定标签的领域的百分比;③音频:所有音频分类中,安静的标签的比例,例如在学习领域或教室、高水平的固定标签(例如不看手机)可以被粗略地认为是学习“专注”或关注课堂学习,高水平的安静标签可能表明专注学习,反之亦然。使用行为空间及其属性,可以更好地评估学习和社交行为。   (二)学习行为
  每个学生上3门课,分别安排在每周的特定时期。课堂时间分三类:65分钟,每周三次;50分钟,每周四次;110分钟,每周两次。此外,每堂课有一个额外50分钟的X时间,讲师可以用也可以不使用。最早的课程开始于上午8:45时,最晚的课程是下午5:50。学生的成绩单表明他们所上的课程。注册处有课程表及上课地点。研究人员使用地点、日期(即周一至周五)和时间自动确定一个学生上课没有,即在位置上的停留时间为至少90%的预定时间(例如110分钟)。使用这个方法,电话可以自动确定学生参加的课程和他们的出勤率。图1b显示了一学期的上课出勤率。
  使用行为空间信息来确定学习行为。研究人员试探性地规定一个学生在学习领域(例如图书馆、实验室、学习室、咖啡馆等)的停留时间是至少20分钟(少于20分钟则被认为不太可能是真正的学习)。除了停留时间,研究人员使用活动和音频属性,以确定一个学生在一个研究区域的专注程度。活动的价值指的是电话的移动频率——表示人要么是在研究区内移动,要么没有移动但在使用电话。研究人员考虑了一些情境,如果一个学生在学习场所(例如图书馆)四处移动被认为这是不够专注的。如果电话大多是固定在一个研究领域,则认为这有助于集中精力。还使用音频属性来研究环境噪声水平。研究人员认为安静的环境可能有助于专注研究而噪声环境不利于专注。图1a显示了所有学生的持续时间和专注力的变化。在专注力方面,更高的活动值表示学生的移动较少,从而学习专注度更高;更高的音频值表明,学生在一个相对安静的环境中,这是更有利于集中精力的一个条件。研究人员并不把这些值融合,而是把它们作为独立变量进行分析。不可否认,该研究尚存不足之处,活动和音频属性只能是粗略的研究。例如,对有的学生来说,在咖啡馆的噪音环境中学习可能更适应他们的个性,相比安静的图书馆,噪音更有利于他们的学习。此外,研究也不能分辨学生是实际真正的学习还是在浏览在线社交网络。此外,如果学生在小组中学习的话,会话数据会被认为是一个嘈杂的环境。最后,研究的推理精度建立在标记达特茅斯大学著名的研究区域的基础上。对于学生在标记领域之外的学习,数据将不能反映。此外,如果一个学生在标记的学习领域静静地看体育博客或睡觉,数据也无法反应。即使有这些限制,我们认为行为空间与停留时间、活动和音频属性相结合的方法提供了一种新的研究学习时间和专注度的方式。
  (三)社会行为
  原始学生生活数据集使用的术语“社会行为”指学生之间面对面的交谈,此项研究中扩大到包括其他更高水平社会性行为,如学生一周或一个学期内聚会多少次、聚会多长时间。
  达特茅斯位于汉诺威的小镇上,达特茅斯学院有三个大型饮酒之夜大学生可以参加——星期三、星期五、星期六晚上。星期三的晚上是在希腊的住宅,星期五和星期六都是校园大派对。星期日是休息的日子,学生会回到学术上,以便在学术周开始之前取得进展,此外还会有朋友之间的聚会。
  研究人员考察行为的空间(例如希腊的住宅、宿舍)和他们的属性来推断一个学生是否在聚会。如果一个学生是在聚会中,则认为他们将会来回移动,以及周围有对话或音乐的声音。此外还考察每周的兄弟会和联谊会聚会(即星期三、星期五、星期六)。研究人员丢弃聚会地点的停留时间在30分钟内的数据。
  研究人员把每个希腊房子停留期间划分为10分钟一个,计算音频和活动属性。假设音频和活动属性在学生聚会和不聚会时应该是有显著不同的。使用K-均值聚类为音频(例如音乐或被一大群人包围)和活动(如跳舞)属性找到聚会阈值。图2a表明一个学生的音频属性(即沉默标签的百分比)是低于40%时,更可能是在一个派对上。奇怪的是,研究人员没有在活动属性上发现有显著差异。通过融合音频,停留时间和位置,可以区分学生是否在聚会。为了验证该聚会推理方法,研究者比较了每周聚会的持续时间与已知的学期内聚会天数。图2b显示在10个星期的时间内为所有学生统计的每个工作日的平均聚会数据。显然星期三和星期五是校园里的大夜晚。此外,星期四和星期六也是很流行聚会的夜晚。星期日和星期一都不是派对之夜,学生有可能要赶学术任务。从智能手机得到的数据强烈支持了前面所讨论的每周聚会模式。图2c显示一个学期内聚会的趋势。聚会的季节高峰在学期的第二周,此后直到學期中这段时间是稳定地下降,第7周时回升, 因为有一个全校范围的春季节日称为“绿色关键周末”。最后,宿舍是另一个学生社交的地方。显然,这些事件并不是大聚会。研究人员使用同样的方法,如上面所讨论的,以确定一个学生是否在宿舍参与社交。
  五、捕捉行为变化
  研究人员讨论了从低级别的自动感应(例如睡眠时间)和EMA数据(如压力)中得到的行为改变特征和高水平的学习和社会行为,为每个学生的每一个行为创造时间序列。使用数据预处理将不同形式的行为数据转换为统一的时间序列格式。行为时间序列将每一天每一个行为作为样本。数据预处理后,每个时间序列总结了不同的行为(例如身体活动、谈话频率和持续时间、睡眠、社会行为、学习行为)。为了理解学期内行为的变化,研究者提出了两种特点:行为斜率——捕捉整个学期内改变的幅度(例如睡眠增加或减少);行为断点——捕捉个人行为发生变化的特定的点,断点的数量表明一个学生的变化频率。除了看学生一天中的行为,研究人员把一天划分为三期。具体而言,把凌晨至上午9点之间的时间标签为夜间,上午9点到下午6点标记为白天,下午6点到次日上午12点为晚间。
  (一)行为斜率
  Rui Wang等感兴趣的是在学期中量化学生的行为改变。例如,一个学生是否积极主动、勤奋好学、社会活跃度多少等。研究人员使用线性回归为每个学生计算每个行为时间序列走势捕捉其行为变化(例如室内活动、压力、影响)。斜率的价值指示行为改变的方向和强度。具有更大绝对值的正斜率表示行为改变(例如聚会)更快地提高。相比之下,具有更大绝对值的负斜率表示更快地降低行为级别(例如课堂出席率)。例如考虑一个学生在一个学期里每天独立的对话数量,“斜率=0”意味着学生在一个完整的时期内每一天有相同数量的对话,这是极度不可能的。“斜率<0”意味着学生在一学期里对话越来越少。最后,“斜率>0”指学生在学期内有越来越多的对话。行为的斜率考虑行为的动态性和学生之间的个体差异。就像在学生生活的讨论研究中说的,学期中期(如图1b所示,第4和5周)是一个重要的里程碑。研究人员选择“中期点”作为衡量行为斜率的一个点。这一点是10个星期中最中间的一天。学生的工作量比开始时增加了,如图1b所示。期中过后学生有更多的项目和更大的任务,一直到期末考试。在学期中点对行为时间序列分区,使用2条线性回归拟合时间序列,从学期开始到期中考试(即上半学期),从期中到学期末(即下半学期)。使用“前斜率”和“后斜率”来表示学生在前半学期和后半学期的行为变化。此外,为全体学生计算一个“学期斜率”。   (二)行为断点
  前斜率和后斜率点被用于理解学生的行为改变。然而,许多学生会在学期中点之外的时间点改变行为。学生可以因很多不同的原因制定或改变经历(例如上课增加或减少、学习投入增加或减少)。例如,一些学生可能会在学期开始时改变学习行为,以适应不断增加的工作量,而其他人可能会反应慢一些。研究人员使用行为时间序列为每个学生计算“行为断点”。在这个学期里找到一天,在这一点上学生行为前后的行为模式不同,研究者称这一天为行为中断点。例如,假设一个学生每一天花了相似的时间学习,然而在某一天之后,学生花越来越多的时间学习。研究人员认为这一点变化是一个断点。影响断点的因素很多。不同的行为(例如压力增加或减少、情感和学习)可能有不同的断点。断点的那一天可能会显示一个学生因为一个事件而改变的速度有多快。使用2条线性回归来测试数据,使用贝叶斯信息准则(BIC)选择最佳模型。BIC是一个模型选择标准,使用尽可能少的模型参数选择一个有良好预测性能的模型。较低的BIC值表示一个更好的模型。研究人员认为一个好的分段拟合模型是BIC最低的模型,低于单一回归模型。如果选择单一的回归模型,断点则被设置为“最后一天”。使用学生行为断点可以分析学期内发生变化的速度,了解个体差异。
  六、相关性分析
  为更好地理解学生行为、情绪、心理健康、个性与学术成绩之间的关系,研究人员进行了皮尔森相关性分析,发现了一系列强大的和显著的相关性。
  (一)春季学期的GPA
  春季学期成绩平均为3.3306,标准偏差为0.7983。然而,偏斜是-1.7725,意味着大多数的学生获得了高的GPA,只有小部分学生得到低分(图3c)。在学生生活的研究中,发现春季学期GPA与室内的活动性呈负相关,与谈话频率和持续时间呈正相关,如表3所示。研究人员发现学习和社会行为与GPA之间有显著的相关性。在社会行为方面,发现学生花更多的时间在聚会、兄弟会或联谊会上时,是不太可能有高的GPA的(r=-0.398;p=0.029)。此外,在期中考试点之前,学生的社交更多在他们的宿舍而不是在联谊会时,更可能有更高的GPA(r=0.363;p=0.049)。在学习行为方面,发现花更多的时间在学习上的学生有更高的GPA(r=0.381;p=0.038)。此外,到期中时致力于学习的时间在不断增加的学生,更有可能有更好的成绩(r=0.397;p=0.030)。从自动感应中推断出的其他行为,研究人员发现,整个的体力活动减少与春季学期的GPA呈现负相关,特别是在期中以后(r=-0576;p=0:001),意味着那些体力活动减少的学生更可能有更高的GPA。研究人员在白天、晚上、夜间的时段里找到了类似的室内移动趋势和活动趋势。有趣的是,有更高GPA的学生更倾向于在期中到来之前增加室内的活动性(r=0.423;p=0.020),并减少了他们在中期点以后的室内活动性(r=-0.515;p=0.004)。此外,这些成绩高的学生整个学期下来往往在宿舍里要花费更多的时间(r=0.437;p=0.016)。最后,研究人员发现了感知的压力规模与春季学期成绩呈负相关,意味着压力较小的学生更可能有高的GPA(r=-0.405;p=0.050)。
  (二)累积GPA
  累积GPA平均为3.4215和标准偏差为0.3978。GPA分布见图1c。在学生生活的研究中,研究人员发现累积GPA与活动持续时间和室内流动性呈负相关,并与蓝牙协同定位的数量呈正相关,如表4所示。
  研究人员发现学习和社会行为与GPA之间有显著的相关性。花更多时间学习的学生更可能有更高的GPA(r =0.518;p =0.003)。此外,在他们的活动(即他们的电话是更固定的,r=0.430;p=0.018)和音频(即在安静环境中学习,r=0.380;p=0.038)属性上更专注的学生更可能有更高的GPA。然而,学习的专注趋势显示,拥有更高平均成绩的学生往往有在期中考试前呈现专注力减弱(即活动属性)和喜欢在不安静的地方(例如咖啡厅)学习的趋势。出席率不与GPA相关。不过研究发现,在中期考试前的出勤率正向变化与GPA相关,即学生在期中考试之前出勤率的增加更可能有高的GPA(r=0.470;p=0.009)。
  从自动感应中推断出的其他行为,研究人员发现GPA和行为变化趋势之间的相关性较大。在中期以前体育活动水平增加(r=0.418;p=0.022)或在中期以后减少(r=-0.449;p=0.015)的学生更可能有更高的GPA。同样,在中期前室内移动多(r=0.425;p=0.019)或中期后室内移动增多的学生(r=-0.426;p = 0.021)更可能获得更高GPA。看学生的总体行为变化,其在整个学期中室内移动速度慢慢增加或减少,更可能有更高的GPA(r=-0.387;p=0.035)。在日常会话方面,在中期后不断增加会话持续时间的学生更可能有更高的GPA(r=0.443;p=0.016)。关于会话频率,学生有较晚的断点(即在学期内改变他们的日常会话频率模式更晚)可能有更高的GPA。
  从调查的心理特征数据来看,发现PHQ-9 评分与GPA呈负相关(r=-0.470;p=0.027),这意味着更沮丧的学生往往有较低的成绩。在大五项框架调查中更为认真的学生往往有较高的GPA(r=0.551;p=0.004),倾向于神经质的学生更有可能有较低的GPA(r=-0.423;p=0.035)。
  七、预测分析
  研究人员提出了一个简单的预测GPA的模型。使用线性回归和Lasso正则化从大量的输入特征中确定非冗余的预测因子。这些预测因子包括自动感测时间序列的行为数据(即会话和学习特征)、EMA时间序列数据(例如正影響和压力)、心理健康数据(如抑郁症)和个性数据(即责任心)。
  (一)预测模型   预测成绩是一个回归问题:从一组输入因子中预测结果变量(即GPA)。研究人员使用交叉验证评估各种回归模型,如线性回归、回归树,支持向量回归。选择Lasso(最绝对的收缩和选择算子)正规化线性回归模型作为预测模型。Lasso是一种用于线性回归的方法,Lasso与系数的绝对值上限结合,使平方误差最小化。考虑到有大量的功能,需要解决多重共线性。有2类方法解决共线性——特征选择和特征变换。Lasso正则化是其中的一个特征选择方法。
  Lasso解决了下面的最优化问题:
  min((yi-βo-xT
  iβ)2 λβj)
  N是观察的数量,yi为i的观察地面真值;xi是i观察的p等级特征向量;λ是一个非负正则化参数,控制β的非零因素(即所选特征的数目);β0 是拦截;β是权重向量。正则化参数λ选择使用交叉验证。本质上的优化问题是最大限度减少均方误差N
  i=1(yi-βo-xT
  iβ)2,同时还要尽量保持模型的简单(即选择最小数量的特征,避免过度拟合)。因此,Lasso会自动选择相关的功能(即预测算子)和丢弃冗余功能,避免过度拟合。
  (二)评价指标
  研究人员使用平均绝对误差(MAE)、决定系数(R2)和皮尔森的关系衡量结果预测的性能。MAE测量算子和预测结果的相近程度。平均绝对误差由M|AE=N
  i=1yi-βo-xT
  iβ算出。MAE值越小越好,因为它表明该预测更接近地面真相。R2是衡量模型拟合优度的,并指出模型解释的方差有多大。R2的范围从0到1,其中1表示数据与模型的完美拟合。R2可以看作是对不明变量的相关方差,如果特征向量X并没有什么结果,那么R2=0。研究者使用皮尔森相关性测量地面真值与预测结果之间的线性关系。
  (三)GPA的预测结果
  研究者使用交叉验证来确定Lasso的参数和每个特征的权重。为了使权重正规化,每一个特征都限制在缩放范围[ 0,1 ]。选定的特征含有非零权重。预测累积GPA的MAE是0.179,说明这些预测是在真实值的±0.179。R2为0.559,这表明特征可以解释55.9%的GPA方差。预测成绩与(r=0.81;p<0.001)的地面真值密切相关,这进一步表明,该预测可以使用给定的特征来捕捉成绩差异。
  表5显示选定的特征来预测累积GPA及其权重。有趣的是,Lasso选择了1个单一长期措施(即有责任心的人格特质)、2个自我报告时间序列特征(即情感和压力)和3个自动感应数据行为(即会话和学习行为)。权重表明预测因子的强度。有更好平均成绩的学生更认真,学习时间更多,情绪更积极(例如快乐、兴趣、机敏),但在中期以后,显示了正面情绪的下降,同时平均成績好的学生在学期内呈现压力逐渐减小的趋势,在6-12点的晚间时谈话较少,出现谈话时长模式的变化(即行为的断点)较晚。在春季学期GPA,Lasso不选择特征来预测,相反,它选择使用单独的因子来预测春季学期GPA。它选择了一个单值3.40预测所有MAE=0.53,中位绝对误差0.38的学生。研究者认为这是由于春季学期的GPA偏斜,如图3c所示。注意,一般春季学期的GPA是3.3306。Lasso选取的干扰因子接近平均GPA,与偏斜率相符。
  八、结论
  研究人员发现一些学生的行为改变模式(即斜率和断点)与学业成绩相关性显著。通过行为变化建模,使用行为的斜率和断点,可以了解不同的学生在他们的生活中如何反应。在本文中研究人员发现,时间序列分析能够量化个体行为在10周的差异。还发现斜率和断点与成绩很相关,在某些情况下是强大的影响因素。
  在社交方面,研究人员的研究结果表明,学生谈话持续时间的改变是显著的成绩预测因子。具体而言,晚间谈话持续时间表现出较晚变化的学生有更高的GPA。在晚上谈话持续时间上表现出减少的学生,也有较高的平均成绩。这些发现是新颖的,扩展了以前的工作,演示了学术表现与社会参与的关系。研究者的研究结果表明学生的社交模式的改变是学习成绩重要预测因子。例如,研究结果表明,对比那些较早改变了他们夜间社交时间的学生,较晚改变夜晚社会活动时间的学生学习表现较好。此外,相比那些增加了晚上社交时间的学生,晚上社交时间减少的学生学习表现较好。研究人员怀疑这些学生可能在为考试做准备,专注于在晚上的工作(例如学习),这可能导致在所观察区域的谈话时间的减少。此外,研究人员的研究结果与以前的研究是一致的,如发现晚上外出的大学生成绩较低。
  谈到学术相关的行为,研究者的研究结果表明学习的持续时间是一个显著的预测性能。更具体地说,相比于学习时间短的学生,平均学习时间较长的学生在学期结束的时候有较高的平均成绩。这一发现和发现学习技能(例如学习技巧和习惯)与GPA相关的研究是一致的。该研究结果超越了学生自我报告的学习方法,发现一些潜在的学习习惯(例如通过WiFi和GPS捕捉的)也可以预测学生成绩。与以往的研究相比,研究没有发现上课出勤率是一个显著的成绩预测性能,并没有观察到其他研究表明的课堂出勤率和平均成绩的简单的相关性。如图3所示,考察学生的成绩分布情况和出勤率,发现有更高分数的学生出勤率或高或低,而那些低分的学生有中等出勤率。数据显示,对一些成绩高的人,参加讲座不影响他们的成绩。研究者相信学生的出勤率是按他们的课程确定的,成绩高的学生可能不需要去上课也能获得高分。
  在个性方面,研究人员的研究结果表明,责任心是一个显著的预测特征,比较那些自觉性较差的学生,自觉性高的学生有较高的平均成绩。这一发现与大学生自我报告人格特质与学业的关系心理研究相一致。虽然神经质不对学生的平均成绩有显著的预测作用,性格特点和GPA的简单相关性研究显示神经质与累计GPA成绩呈负相关(r=-0.42),这表明神经质较高的学生有较低的平均成绩。   在情绪方面,研究结果表明,积极的情绪水平和变化是显著的预测性能。具体而言,学生具有较高的积极的平均情绪水平到学期结束时有较高的平均成绩。在中期后减少积极情绪的学生也有更高的GPA。这些研究结果与以前的研究是一致的,表明更积极的影响和更高的成绩与平均成绩的关系。有趣的是,以前的研究已经发现在下半年增加负面影响会导致低成绩和GPA。然而,该研究发现,积极的影响在下半年减少与较高的GPA相关。研究人员怀疑相比于没有投入学习的学生,在下半年学生专注于他们的任务和性能时,不太可能报告感觉非常积极的情绪(例如兴奋、热情)。
  在压力方面,研究结果表明,压力的变化是一个显著的预测性能,学生在整个学期压力不断减少,期末有更高的GPA。这一发现与以前的研究发现学生压力和平均成绩之间的负相关关系是一致的。相比在课堂上表现不佳的学生,那些在课堂上表现出色的学生,随着学期的进展,压力越来越小。这与以往的研究是一致的。
  据我们所知,该研究第一个,也是最好的一个使用智能手机自动遥感数据和时间序列的均线预测成绩的。预测成绩与地面真值密切相关(r=0.81;P<0.001),MAE为0.179,R2为0.559。该研究预测GPA不使用任何先验信息,如SAT、智商测试结果,或已知的学生成绩。通常,学生成绩会通过他们的作业得分和期中考试来评测水平,研究结果表明,有一些其他成功的学业预测因素。预测模型表明,取得更好成绩的学生是更认真、学习更多、积极的情绪更多,但在期中考试后的积极情绪出现下降、有较小压力的学生,以及在晚上的谈话中是不那么活跃的,并且在学期后谈话时间模式发生了改变的学生。在本文中讨论的相关性和预测模型,会引发新的提高学习成绩的潜力干预措施。该项研究可以作为新的催化剂来促进实行新的干预形式,以帮助学生提高学习成绩。研究以一种全新的形式建设精细化的验证预测模型,从多种属性方面捕捉、量化学生的行为变化,进而引发新的提高学习成绩的潜力干预措施,这对高校学业成绩的评估而言具有创新性的意义。
  同时我们也看到了目前该项研究的局限性。虽然数据集是大的、丰富的,但在这项研究中学生的数量是小的(30个)。受这样一个小数据集限制,不能使用更先进的预测模型或功能,因为它可能会导致过度拟合。预测结果中看到,Lasso从193个特点中只选择7个特点,尽管研究发现了更多的相关性。再者,达特茅斯大学是常春藤联盟的文科大学,学生都是在高中的佼佼者。因此,研究的样本是偏向成绩较好的学生。最后,样本中的学生并不都是电脑科学专业的学生,因此都参加了相同的课程——安卓程序设计。因此,样本可能局限于理科生,不代表文科学生。我们相信如果有一个更大规模、涉及更多不同大学的学生的跨机构研究可以提供更多样化和更有代表性的样本,能够更好地细化和验证预测模型。
  参考文献:
  [1]Rui Wang, Gabriella Harari, Peilin Hao, Xia Zhou, Andrew T. Campbell. Smart GPA: How Smartphones Can Access and Predict Academic Performance of College Students. Dartmouth College, The University of Texas at Austin. 2015.
  (編辑:王天鹏)
其他文献
摘 要:传统学习对我们仍有重要的影响,每个人都不可能脱离传统方式的学习,传统学习对人们的学习观养成有着决定的作用。网络时代的到来,e-Learning的兴起,给学习者以新的思维和媒体应用,e-Learning有着传统学习不可比拟的优势,使学习者如虎添翼。但是,不论是传统学习还是e-Learning,其本质是学习,只有学习者才能真正领悟其优势。  关键词:传统学习 e-Learning 学习模式 以
摘 要:为了解决目前微课表现形式比较单一的现状,我们尝试把虚拟场景技术引入微课制作领域,设计了基于虚拟场景技术的开发模式,包括前期设计,中期制作,后期反馈三个阶段,在中期制作阶段,结合相关软硬件设备,构建了微课开发流程。在此基础上,我们进行了微课开发实践,并应用于教学中,通过师生访谈,效果测试,认为微课设计比较新颖,案例取材真实生动,与真人互动更增添加趣味性,深受师生的欢迎,为类似题材的微课开发提
摘 要:本文首先阐述了传统高等教学模式中一直存在的弊端,然后分析了MOOC的教学模式特点与其发展中遇到的问题,最后将两种教学模式进行有机地整合,优势互补,实施混合教学模式,并简单介绍了如何将两种教学模式进行融合、混合教学模式的优点以及实施混合教学模式时需要注意的地方。以期为高等教育课程教学改革提供一条新的思路。  关键词:MOOC;高等教育;教学模式;混合教学  中图分类号:G434  文献标志码
摘 要:为了促进教育教学观念转变,引领教学内容和教学方法的改革,推动课程教学资源通过现代信息技术手段共建共享,提高人才培养质量,国内各高校纷纷开始了精品资源共享课的大力建设。本文以我校计算机组成原理课程为例,展示了省级资源共享课平台的建设情况,包括需求分析、设计方案以及ASP.NET MVC架构下的开发实现,对其他省级和国家级资源共享课平台的建设具有很好的参考和借鉴价值。  关键词:精品资源共享课
摘 要:在我国基础教育信息化经费投入快速增长的同时,很多问题也逐渐显现出来。本文从经济和财政的视角对基础教育信息化经费投入进行了分析。研究发现,我国基础教育信息化经费投入的充足程度不断提高,但是经费投入的效率仍然较低,而且教育信息化的公平程度受到教育财政体制的约束。本研究建议通过顶层设计和基层创新相结合、改革教育信息化经费制度以及加强教师队伍人力资本建设的方式解决以上问题,以此推动基础教育信息化更
摘要:本文通过剖析大学知识资产管理的需求持续性,满足机构知识资产管理、机构知识传播和机构知识能力三个层面的目标,结合DSpace系统特征,与大学URP数字化校园建设集成,提出大学个性化知识资产管理系统的设计和实现。  关键词:DSpace;知识资产;大学URP数字化校园  中图分类号:TP315文献标识码:B文章编号:1673-8454(2012)15-0060-04  一、前言  高校图书馆承担
摘 要:区域教育管理信息化是国家教育管理信息化的有机组成部分,是实现教育现代化的必要内容。教育信息化已进入2.0时代,探索信息化时代的教育治理新模式是其一项重点工作,互联网、大数据等技术的快速发展对管理信息化提出了更高要求,区域教育管理信息化建设与应用工作面临着新任务和新挑战。本文立足焦作工作实际,阐述了合理布局地方教育管理信息系统相关内容;并对区域教育管理信息化应用与实践开展了有益探索和研究。 
《中国教育信息化》:不久前,中国电信集团教育信息化行业应用基地落户兰州,请介绍一下基地成立的宗旨是什么?作为运营单位,甘肃万维公司在教育信息化行业有哪些成功经验?  李忠:推进教育信息化建设,建立教育信息化应用基地,既是中国电信战略转型的目标之一,也是中国电信履行央企责任、推动社会发展的体现。这次成立教育行业信息化应用基地,目的就是通过建立市场化的创新机制,适应移动互联网时代服务的市场规则,满足教
本文献给大叔。大叔失踪多年。我爸吴刘振祥,小叔吴刘元祥,大叔吴刘祖祥,他们是我奶奶的吉祥三宝,更像是一只三足鼎,长久缺一足。  一一文外话  一  两个月前,我在泊富四楼费大厨吃饭。一个人。被个学生放鸽子。我来长沙十六年,学生晚我几年到,他先是在岳麓山下念大学,之后进入河西一家大型民企,中意重工,始终未挪窝,从车间工人干起,干到中层管理。他的外表,跟他内心一样执着,发型永远是下面削光,上面留一寸多
摘 要:教育技术国际论坛(International Forum on Educational Technology)是教育部高等学校教育技术专业教学指导分委员会主办的国际性学术会议,第十五届教育技术国际论坛(IFET2016)于2016年8月18-20日在东北师范大学召开。本文采用内容分析法与词频分析法对第十五届教育技术国际论坛的论文集中的140余篇文章按照主题内容进行梳理,以此探究教育技术目前