基于情感挖掘的学生评教系统设计及其应用

来源 :中国电化教育 | 被引量 : 0次 | 上传用户:fijihi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:学生评教是高校普遍实行的一项管理制度,评教结果的有效性,即评教的质量受到教师、学生、教学管理者的高度关注。该文利用语义分析技术对学生留言进行情感挖掘,建立基于知网的情感词库,并设置词的极性权重;以3GWS工具进行分词与词性标注;对留言的情感褒贬程度进行计算,形成教师的评价摘要。以烟台大学评教数据为实验数据,验证该方法科学、有效。
  关键词:学生评教;情感分析;学生留言;数据挖掘
  中图分类号:G434 文献标识码:A
  随着我国高等教育的大众化,《国家中长期教育改革和发展规划纲要(2010-2020年)》明确指出提高质量是当前高等教育的核心任务,是建设高等教育强国的基本要求。如何保证和提高高等教育教学质量已成为高等学校深化教育教学改革的焦点和全社会关注的热点。教育部《关于深化高校教师考核评价制度改革的指导意见》(教师[2016]7号)文件,对师德考核、教学业绩、科研评价、社会服务在职称中的作用、教师自身发展等提出了一系列具体措施。学生评教是教学工作考核评价的重要维度之一,是学生依据一定的评价指标对教师的教学态度、教学方法、教学内容、教学效果等方面做出定性或定量的评价。“评价最重要的意图不是为了证明,而是为了改进”,学生评教已经成为高校普遍采用的教学评价与管理制度,成为了各高校内涵发展的重要措施之一。
  在我国,学生评教自20世纪七八十年代出现起,便受到学术界的广泛关注,研究者们对学生评教的作用、中外比较、价值取向、评教工具、评教结果的有效性等展开了深入研究,其中结果的有效性被认为是研究的焦点,得到教师、学生、教学管理者的高度关注,研究者主要对学生的客观评价进行统计与分析,而对学生评教中学生主观留言的分析与挖掘基本没有涉及,本文提出了基于情感挖掘的学生主观留言倾向性分析模型,建立了基于知网的情感词典库,利用3GWS工具对留言进行分词与词性标注;通过对留言的情感褒贬程度计算,形成教师的评价摘要,并通过烟台大学评教数据验证其有效性、科学性。

一、学生评教的研究现状


  上世纪20年代初,美国在高校中开始学生评教活动。1984年,北京师范大学通过问卷的方式对教师的教学质量进行评价,学生评教一度成为国内外研究的热点,并取得了丰硕的成果,对学生评教的研究基本分为基本理论研究和实践研究两个方面,基本理论的研究主要关注学生评教的权利、作用、意义、价值取向、中外比较与本土化等方面,其中梅萍等研究了近十年我国高校学生评教有效性问题;韩天学等研究了美国高校学生评教体系,并通过实例证实本土化的可行性;罗玉萍等研究了在普通高校开展学生评教的必要性及具体方法。实践研究主要是关于学生评教的有效性研究,包括指标体系设置、评教工具的设计、评教结果的统计分析方法、结果的应用等。其中潘庆先等利用关联数据挖掘技术对学生评教的评价指标体系的权重进行设置;马秀麟等从大数据挖掘的视角分析学生评教的有效性;谭征、潘庆先等利用中文文本挖掘技术建立了中文评教文本分类模型;傅龙等通过听评课的方法实证研究了新教师与经验教师评价的方法;郑燕林等分析了美国利用大数据分析技术进行教育评价的方法和路径;罗玉萍等对学生评教工作的动员、分类评价、数据处理、结果与反馈等过程进行了研究并以烟台大学为例证实其有效性。
  随着学生评教工作的普及与深入,评价结果的有效性越来越受到广大教师、学生、教学管理者的关注。纵观对学生评教结果有效性的研究,大部分都集中在客观性评价的统计与处理上,其中潘庆先等采用了课程分类、学生分年级的方法,利用标准偏差来纠偏的数据处理技术对学生评教中客观评价部分进行处理,并成功应用于烟台大学,得到了广大教师的认可。
  但對于学生主观留言部分的研究很少有所涉及,学生留言是学生在评教过程中对教师的主观评价,其中有褒奖之词也有中肯之建议,作为学生评教中重要的组成部分,学生留言也是教师与学生进行交流的重要方式。对于学生留言的处理方式大部分高校将留言直接反馈给教师本人,并没有对学生留言进行任何处理,也没有在留言中挖掘有效信息。烟台大学每学期学生留言约16万条,期初采用人工过滤的方式,工作人员将所有留言进行分类,把留言分为:正常、不适合给老师看、上课迟到、接听电话、要求换老师、普通话不标准等类别,分类后再将相关留言反馈给教师本人,发现异常情况后及时与相关学院主管教学领导联系,这种做法保证了教师对教学的积极性,保护了教师不受学生不恰当言辞的伤害,也能够发现教师教学过程中的优点和不足,但这种做法所需人力较大。后来利用关键词过滤技术将学生留言进行筛选过滤,这种做法虽然提高了效率,但容易受到关键词库的影响,容易遗漏有用的信息。
  本文提出了对留言进行情感分析的方法,通过情感分析技术对每条留言进行情感计算,把学生留言以定量的方式表示其情感强度,设置强度阈值,达到阈值时,自动形成教师的评价摘要。

二、情感分析相关技术


  情感分析又称意见挖掘(Opinion Mining),旨在利用计算机技术研究人们针对物体、个人、事件、主题及其属性的主观意见和情感,对文本的观点、情绪、情感极性做出判断。情感分析是自然语言处理领域的一个重要话题,旨在对无结构的主观性文本进行分析、处理和归纳,最终形成方便机器理解和用户使用的结构化数据。情感分析是一个多学科综合的领域,涉及语言学、统计学、心理学、机器学习、人工智能等领域的理论与方法。内容涉及多层语言分析技术,如分词、词性标注、命名实体识别、句法分析、社会网络构建等。
  文本情感分析分为两个步骤,首先需要对文本来源进行处理,对文本进行主客观分类,从主客观混合的文本中将描述事实的客观性文本与表达意见的主观性文本区分开来,将主观语言的文本抽取出来,过滤掉不带情感色彩的文本。下一步是对主观性文本的分析,主要包括文本情感极性分析和文本情感极性强度分析。
  由于学生评教的留言基本都为中文,中文文本的情感分析过程包括了分词、词性标注、情感词提取、情感词典的构建、情感极性判断等过程。   (一)中文文本的分词
  中文分词是指将组成句子的汉字序列用分隔符加以区分,切分成一个个单独的词,它是中文文本处理的基础。经过学者们三十多年的研究和探索,中文分词已取得了长足的进步,分词的准确率得到大幅提高,特别是在使用了机器学习和基于统计的方法后,中文分词效果有了显著的进步。
  本文采用第三代智能分词系统3GWS,3GWS是飞嘉华公司智能分词系列的产品,它是在继承优秀研究成果ICTCLAS自由源代码的基础上,综合统计方法、语义网络、模式推理与语言进化论等领域的最新研究成果。其主要功能有汉语智能分词、命名实体与新词识别、词性标注以及支持用户自定义词典。分词界面如图1所示。
  (二)情感词抽取
  情感词又称极性词、评价词语,特指带有情感倾向性的词。一般情感词有褒义和贬义两类极性。情感词抽取是情感分析的基础,因此引起了学者的广泛关注和研究。情感词抽取目前主要分为基于语料库和基于词典的两种研究方法。基于语料库的情感词抽取和判别主要是利用大语料库的统计特性,优点在于简单易行。基于词典的方法具有获取情感词全面、准确的优点,但是由于存在一词多义现象,构建的情感词典往往含有较多的歧义词。
  本文提出了基于词性的情感词抽取方法,提取留言中所关心的词性,比如:形容词、副词、程度词;为了形成自动摘要,本文把相关名词和动词与进行提取,建立了关心词性表(见表1),表的内容可以根据不同领域自行增减。
  (三)词语的情感极性
  判别词语的情感极性是文本情感分析的基础,为了定量表示词语的情感程度,通常用[-1,1]之间的某个小数作为情感权重,来表示词语的褒贬程度。如果权重大于0,则表示词语为褒义词;情感权重小于0,则表示词语为贬义词。情感权重的绝对值越大则意味着词语的褒贬程度越大。
  词语的情感极性判别主要有基于语料库和基于词典两种方法。基于语料库的方法主要是利用词语之间的连词以及统计特征来判别词语的情感极性。基于词典的方法是利用中文词典知网提供的语义相似度或者层次结构来判别词语的情感极性。
  本文采用基于知网的情感极性标注方法,褒义词赋权为1,贬义词赋权为-1,程度副词按强度不同分别赋予2、1.5、0.8、0.5的权重,名词、动词赋权0,否定词为“-1”。
  (四)留言的情感分析
  在情感分析的典型应用中,产品评论的情感分析、新闻评论的情感分析、电影影评的情感分析被广大研究者所关注,这些研究具有一定的商业价值和社会价值。产品评论的情感分析主要任务是获取产品的特征或属性,定位用户的主观性评论,抽取评论词,判别用户评论的褒贬。新闻评论的情感分析是对评论人的评论进行挖掘,可以了解民众对新闻人物和新闻事件的总体评价,及时掌握当前的舆情信息,特别是热点事件的舆情信息,在舆情控制中起到了重要作用。
  本文提出了基于表达式的留言情感分析方法,将褒义词、贬义词的运算符设置为“ ”,将程度副词的运算符设置为“*”。留言的情感褒贬强度计算公式为:
  其中qi为情感词的权重,Ti为词的运算符,o为学生留言的词集合,“
其他文献
一  一个个冬天走马灯似的来了又走远,当发觉这个冬天迈着蹒跚的脚步再次寻找我时,我刚从澳洲回来,时差还没完全倒过来。懒懒地躺在旅行社办公室的沙发上,看着窗外法桐枯黄的叶子,想起多年前那个冬天和二姐见面的情形,那些场景在我脑子里无数遍回放。心里顿时灰暗下去,我并非多愁善感,从小到大都不是,被老师同学戏称为“木头姐”。甚至当发现相恋多年准备谈婚论嫁的男友和我闺密搞上时,也只是哭了一夜,宣泄一通后,果断
金秋时节,索尼公司推出全新教育投影机VPL-E300系列,为课堂大画面应用开启全新篇章。本次发布的VPL-E300系列教育投影机采用全新外观设计,简洁紧凑的白色外观与教室、会议室相得益彰;最高4,200流明亮度,呈现给用户明亮精致的彩色画面;独特的节能、静音、防尘和背部换灯功能,令使用更高效,维护更简便。  具体型号包括:  WXGA分辨率:4200流明VPL-EW348及VPLEW345,380
摘要:自1998年英国全面启动教育信息化工作以来,通过战略规划、机构设置、资金支持、项目立项、考核评估等一系列措施在基础教育信息化建设方面取得了不菲的成绩。该文通过对英国政府相关战略规划、政策报告、核心机构、期刊文献的深入研究,以及笔者亲身感受,从基础设施、资源工具、计算机课程设置、ICT与学科融合、教师发展、评价与管理等方面对当前英国基础教育信息化的现状进行了全面的分析与介绍,并提出了值得我们借
彭克百度滴滴顺风,各式消息蹦跳出来。据说,以前乘车,在支付宝或微信里可以直接预约,自从某空姐坐车遇害惹起轩然大波后,迫于公众压力,也是从善如流,滴滴公司改变了订车方式,得先下载app,以真实身份注册。  网上内容纷纷扰扰,各说各话,不可全信,没准不是这样。  在此之前,彭克从没坐过滴滴。为此,他总是遭到好友江一涛讥笑,说他不像一个现代人。彭克承认,对一切新鲜事物的接纳,他总比别人慢半拍。那又如何,
相信一线数学教师也不时遭遇这样的尴尬:有些数学问题的解答过程看似极其简捷,堪称秒杀,让人赏心悦目,怦然心动!但冷静下来,却又不知如何操作,怎样构思,似乎从天而降,莫名其妙!笔者近日就遭遇到这样难堪的困境,现整理成文,与读者一起分享,不当之处,恳请批评指正。  1案例呈现  2简捷妙解  这是一道经典试题,源自某市高三理科数学质检题的选择题压轴题,客观地讲,类似试题频频出现在各地试卷中,对于上述案例
摘要:“互联网 ”资源是数字教育资源建设与发展的必然趋势,也是“互联网 ”教育整体战略的重要组成部分。“互联网 ”行动计划的大力实施,将为数字教育资源的建设与应用带来新的希望、开创新的格局:人人平等享有高品质的学习资源服务,人人自愿、自由参与资源的创作与传播,优质学习资源实现全球化的无缝流通与共享,每份资源的知识版权都得到全面保护。MOOC、创客课程、STEAM课程、数字教材以及虚拟仿真资源是国际
关键词:“互联网 教育”;数字教育资源公共服务体系;网络扶智  党的十八大以来,以习近平同志为核心的党中央围绕脱贫攻坚作出一系列重大部署和安排。党的扶贫攻坚政策对教育信息化如何开展精准扶贫提出了新的研究课题。吉林省作为经济欠发达省份,城乡之间教育发展差别巨大。为解决这一问题,本文通过依托吉林省数字教育资源公共服务体系,探索出一条基于平台 资源体系服务支撑的模式,形成吉林省城乡义务教育一体化发展的新
摘要:在“大众创业、万众创新”的大背景下,创客教育被作为一种有助于培养学生创新精神与创造能力的重要教育模式引入到中小学教育之中。而作为这种教育模式重要载体的教材,则是彰显创客教育品质的重要标志。教材中所含纳和传递的教育理念与教学模式,将在很大程度上影响创客教育的人才培养实效。研究表明,我国创客教育的相关教材有较强的“技术本位”倾向,而在思维品质与创造能力的提升上均缺乏应有作为。为此,该文以美国IN
陶兴模老师在文献…中依据中学数学教师所表现出来的主要素质特征,将数学教师粗略地划分为四个类型,即表演型、应试型、学者型和竞赛型,其中,学者型教师的特点是“善于研究,善于发现,善于探索,有著书立说的意识.在学术上有一定的研究水平,在刊物上经常有文章发表……”  和不少青年同行一样,自从成为一名中学数学教师,笔者就一直以学者型教师作为自己的专业化成长方向.众所周知,立足于日常教学实践,不断学习和反思是
【摘 要】基于数学核心素养的试题评价,应创新评价的形式和方法,借助SOLO分类理论,把知识技能的评价与数学学科核心素养达成状况的评价有机融合,不仅能更好地体现学生在某一阶段和某一内容的学习上对知识的掌握程度和认知水平,也有助于教师更多地关注在试题讲评中对学生把握数学学习规律的过程评价.  【关键词】试题评价;SOLO理论;核心素养  《普通高中数学课程标准(2017年版2020年修订)》(以下简称