论文部分内容阅读
摘要:学生评教是高校普遍实行的一项管理制度,评教结果的有效性,即评教的质量受到教师、学生、教学管理者的高度关注。该文利用语义分析技术对学生留言进行情感挖掘,建立基于知网的情感词库,并设置词的极性权重;以3GWS工具进行分词与词性标注;对留言的情感褒贬程度进行计算,形成教师的评价摘要。以烟台大学评教数据为实验数据,验证该方法科学、有效。
关键词:学生评教;情感分析;学生留言;数据挖掘
中图分类号:G434 文献标识码:A
随着我国高等教育的大众化,《国家中长期教育改革和发展规划纲要(2010-2020年)》明确指出提高质量是当前高等教育的核心任务,是建设高等教育强国的基本要求。如何保证和提高高等教育教学质量已成为高等学校深化教育教学改革的焦点和全社会关注的热点。教育部《关于深化高校教师考核评价制度改革的指导意见》(教师[2016]7号)文件,对师德考核、教学业绩、科研评价、社会服务在职称中的作用、教师自身发展等提出了一系列具体措施。学生评教是教学工作考核评价的重要维度之一,是学生依据一定的评价指标对教师的教学态度、教学方法、教学内容、教学效果等方面做出定性或定量的评价。“评价最重要的意图不是为了证明,而是为了改进”,学生评教已经成为高校普遍采用的教学评价与管理制度,成为了各高校内涵发展的重要措施之一。
在我国,学生评教自20世纪七八十年代出现起,便受到学术界的广泛关注,研究者们对学生评教的作用、中外比较、价值取向、评教工具、评教结果的有效性等展开了深入研究,其中结果的有效性被认为是研究的焦点,得到教师、学生、教学管理者的高度关注,研究者主要对学生的客观评价进行统计与分析,而对学生评教中学生主观留言的分析与挖掘基本没有涉及,本文提出了基于情感挖掘的学生主观留言倾向性分析模型,建立了基于知网的情感词典库,利用3GWS工具对留言进行分词与词性标注;通过对留言的情感褒贬程度计算,形成教师的评价摘要,并通过烟台大学评教数据验证其有效性、科学性。
上世纪20年代初,美国在高校中开始学生评教活动。1984年,北京师范大学通过问卷的方式对教师的教学质量进行评价,学生评教一度成为国内外研究的热点,并取得了丰硕的成果,对学生评教的研究基本分为基本理论研究和实践研究两个方面,基本理论的研究主要关注学生评教的权利、作用、意义、价值取向、中外比较与本土化等方面,其中梅萍等研究了近十年我国高校学生评教有效性问题;韩天学等研究了美国高校学生评教体系,并通过实例证实本土化的可行性;罗玉萍等研究了在普通高校开展学生评教的必要性及具体方法。实践研究主要是关于学生评教的有效性研究,包括指标体系设置、评教工具的设计、评教结果的统计分析方法、结果的应用等。其中潘庆先等利用关联数据挖掘技术对学生评教的评价指标体系的权重进行设置;马秀麟等从大数据挖掘的视角分析学生评教的有效性;谭征、潘庆先等利用中文文本挖掘技术建立了中文评教文本分类模型;傅龙等通过听评课的方法实证研究了新教师与经验教师评价的方法;郑燕林等分析了美国利用大数据分析技术进行教育评价的方法和路径;罗玉萍等对学生评教工作的动员、分类评价、数据处理、结果与反馈等过程进行了研究并以烟台大学为例证实其有效性。
随着学生评教工作的普及与深入,评价结果的有效性越来越受到广大教师、学生、教学管理者的关注。纵观对学生评教结果有效性的研究,大部分都集中在客观性评价的统计与处理上,其中潘庆先等采用了课程分类、学生分年级的方法,利用标准偏差来纠偏的数据处理技术对学生评教中客观评价部分进行处理,并成功应用于烟台大学,得到了广大教师的认可。
但對于学生主观留言部分的研究很少有所涉及,学生留言是学生在评教过程中对教师的主观评价,其中有褒奖之词也有中肯之建议,作为学生评教中重要的组成部分,学生留言也是教师与学生进行交流的重要方式。对于学生留言的处理方式大部分高校将留言直接反馈给教师本人,并没有对学生留言进行任何处理,也没有在留言中挖掘有效信息。烟台大学每学期学生留言约16万条,期初采用人工过滤的方式,工作人员将所有留言进行分类,把留言分为:正常、不适合给老师看、上课迟到、接听电话、要求换老师、普通话不标准等类别,分类后再将相关留言反馈给教师本人,发现异常情况后及时与相关学院主管教学领导联系,这种做法保证了教师对教学的积极性,保护了教师不受学生不恰当言辞的伤害,也能够发现教师教学过程中的优点和不足,但这种做法所需人力较大。后来利用关键词过滤技术将学生留言进行筛选过滤,这种做法虽然提高了效率,但容易受到关键词库的影响,容易遗漏有用的信息。
本文提出了对留言进行情感分析的方法,通过情感分析技术对每条留言进行情感计算,把学生留言以定量的方式表示其情感强度,设置强度阈值,达到阈值时,自动形成教师的评价摘要。
情感分析又称意见挖掘(Opinion Mining),旨在利用计算机技术研究人们针对物体、个人、事件、主题及其属性的主观意见和情感,对文本的观点、情绪、情感极性做出判断。情感分析是自然语言处理领域的一个重要话题,旨在对无结构的主观性文本进行分析、处理和归纳,最终形成方便机器理解和用户使用的结构化数据。情感分析是一个多学科综合的领域,涉及语言学、统计学、心理学、机器学习、人工智能等领域的理论与方法。内容涉及多层语言分析技术,如分词、词性标注、命名实体识别、句法分析、社会网络构建等。
文本情感分析分为两个步骤,首先需要对文本来源进行处理,对文本进行主客观分类,从主客观混合的文本中将描述事实的客观性文本与表达意见的主观性文本区分开来,将主观语言的文本抽取出来,过滤掉不带情感色彩的文本。下一步是对主观性文本的分析,主要包括文本情感极性分析和文本情感极性强度分析。
由于学生评教的留言基本都为中文,中文文本的情感分析过程包括了分词、词性标注、情感词提取、情感词典的构建、情感极性判断等过程。 (一)中文文本的分词
中文分词是指将组成句子的汉字序列用分隔符加以区分,切分成一个个单独的词,它是中文文本处理的基础。经过学者们三十多年的研究和探索,中文分词已取得了长足的进步,分词的准确率得到大幅提高,特别是在使用了机器学习和基于统计的方法后,中文分词效果有了显著的进步。
本文采用第三代智能分词系统3GWS,3GWS是飞嘉华公司智能分词系列的产品,它是在继承优秀研究成果ICTCLAS自由源代码的基础上,综合统计方法、语义网络、模式推理与语言进化论等领域的最新研究成果。其主要功能有汉语智能分词、命名实体与新词识别、词性标注以及支持用户自定义词典。分词界面如图1所示。
(二)情感词抽取
情感词又称极性词、评价词语,特指带有情感倾向性的词。一般情感词有褒义和贬义两类极性。情感词抽取是情感分析的基础,因此引起了学者的广泛关注和研究。情感词抽取目前主要分为基于语料库和基于词典的两种研究方法。基于语料库的情感词抽取和判别主要是利用大语料库的统计特性,优点在于简单易行。基于词典的方法具有获取情感词全面、准确的优点,但是由于存在一词多义现象,构建的情感词典往往含有较多的歧义词。
本文提出了基于词性的情感词抽取方法,提取留言中所关心的词性,比如:形容词、副词、程度词;为了形成自动摘要,本文把相关名词和动词与进行提取,建立了关心词性表(见表1),表的内容可以根据不同领域自行增减。
(三)词语的情感极性
判别词语的情感极性是文本情感分析的基础,为了定量表示词语的情感程度,通常用[-1,1]之间的某个小数作为情感权重,来表示词语的褒贬程度。如果权重大于0,则表示词语为褒义词;情感权重小于0,则表示词语为贬义词。情感权重的绝对值越大则意味着词语的褒贬程度越大。
词语的情感极性判别主要有基于语料库和基于词典两种方法。基于语料库的方法主要是利用词语之间的连词以及统计特征来判别词语的情感极性。基于词典的方法是利用中文词典知网提供的语义相似度或者层次结构来判别词语的情感极性。
本文采用基于知网的情感极性标注方法,褒义词赋权为1,贬义词赋权为-1,程度副词按强度不同分别赋予2、1.5、0.8、0.5的权重,名词、动词赋权0,否定词为“-1”。
(四)留言的情感分析
在情感分析的典型应用中,产品评论的情感分析、新闻评论的情感分析、电影影评的情感分析被广大研究者所关注,这些研究具有一定的商业价值和社会价值。产品评论的情感分析主要任务是获取产品的特征或属性,定位用户的主观性评论,抽取评论词,判别用户评论的褒贬。新闻评论的情感分析是对评论人的评论进行挖掘,可以了解民众对新闻人物和新闻事件的总体评价,及时掌握当前的舆情信息,特别是热点事件的舆情信息,在舆情控制中起到了重要作用。
本文提出了基于表达式的留言情感分析方法,将褒义词、贬义词的运算符设置为“ ”,将程度副词的运算符设置为“*”。留言的情感褒贬强度计算公式为:
其中qi为情感词的权重,Ti为词的运算符,o为学生留言的词集合,“
关键词:学生评教;情感分析;学生留言;数据挖掘
中图分类号:G434 文献标识码:A
随着我国高等教育的大众化,《国家中长期教育改革和发展规划纲要(2010-2020年)》明确指出提高质量是当前高等教育的核心任务,是建设高等教育强国的基本要求。如何保证和提高高等教育教学质量已成为高等学校深化教育教学改革的焦点和全社会关注的热点。教育部《关于深化高校教师考核评价制度改革的指导意见》(教师[2016]7号)文件,对师德考核、教学业绩、科研评价、社会服务在职称中的作用、教师自身发展等提出了一系列具体措施。学生评教是教学工作考核评价的重要维度之一,是学生依据一定的评价指标对教师的教学态度、教学方法、教学内容、教学效果等方面做出定性或定量的评价。“评价最重要的意图不是为了证明,而是为了改进”,学生评教已经成为高校普遍采用的教学评价与管理制度,成为了各高校内涵发展的重要措施之一。
在我国,学生评教自20世纪七八十年代出现起,便受到学术界的广泛关注,研究者们对学生评教的作用、中外比较、价值取向、评教工具、评教结果的有效性等展开了深入研究,其中结果的有效性被认为是研究的焦点,得到教师、学生、教学管理者的高度关注,研究者主要对学生的客观评价进行统计与分析,而对学生评教中学生主观留言的分析与挖掘基本没有涉及,本文提出了基于情感挖掘的学生主观留言倾向性分析模型,建立了基于知网的情感词典库,利用3GWS工具对留言进行分词与词性标注;通过对留言的情感褒贬程度计算,形成教师的评价摘要,并通过烟台大学评教数据验证其有效性、科学性。
一、学生评教的研究现状
上世纪20年代初,美国在高校中开始学生评教活动。1984年,北京师范大学通过问卷的方式对教师的教学质量进行评价,学生评教一度成为国内外研究的热点,并取得了丰硕的成果,对学生评教的研究基本分为基本理论研究和实践研究两个方面,基本理论的研究主要关注学生评教的权利、作用、意义、价值取向、中外比较与本土化等方面,其中梅萍等研究了近十年我国高校学生评教有效性问题;韩天学等研究了美国高校学生评教体系,并通过实例证实本土化的可行性;罗玉萍等研究了在普通高校开展学生评教的必要性及具体方法。实践研究主要是关于学生评教的有效性研究,包括指标体系设置、评教工具的设计、评教结果的统计分析方法、结果的应用等。其中潘庆先等利用关联数据挖掘技术对学生评教的评价指标体系的权重进行设置;马秀麟等从大数据挖掘的视角分析学生评教的有效性;谭征、潘庆先等利用中文文本挖掘技术建立了中文评教文本分类模型;傅龙等通过听评课的方法实证研究了新教师与经验教师评价的方法;郑燕林等分析了美国利用大数据分析技术进行教育评价的方法和路径;罗玉萍等对学生评教工作的动员、分类评价、数据处理、结果与反馈等过程进行了研究并以烟台大学为例证实其有效性。
随着学生评教工作的普及与深入,评价结果的有效性越来越受到广大教师、学生、教学管理者的关注。纵观对学生评教结果有效性的研究,大部分都集中在客观性评价的统计与处理上,其中潘庆先等采用了课程分类、学生分年级的方法,利用标准偏差来纠偏的数据处理技术对学生评教中客观评价部分进行处理,并成功应用于烟台大学,得到了广大教师的认可。
但對于学生主观留言部分的研究很少有所涉及,学生留言是学生在评教过程中对教师的主观评价,其中有褒奖之词也有中肯之建议,作为学生评教中重要的组成部分,学生留言也是教师与学生进行交流的重要方式。对于学生留言的处理方式大部分高校将留言直接反馈给教师本人,并没有对学生留言进行任何处理,也没有在留言中挖掘有效信息。烟台大学每学期学生留言约16万条,期初采用人工过滤的方式,工作人员将所有留言进行分类,把留言分为:正常、不适合给老师看、上课迟到、接听电话、要求换老师、普通话不标准等类别,分类后再将相关留言反馈给教师本人,发现异常情况后及时与相关学院主管教学领导联系,这种做法保证了教师对教学的积极性,保护了教师不受学生不恰当言辞的伤害,也能够发现教师教学过程中的优点和不足,但这种做法所需人力较大。后来利用关键词过滤技术将学生留言进行筛选过滤,这种做法虽然提高了效率,但容易受到关键词库的影响,容易遗漏有用的信息。
本文提出了对留言进行情感分析的方法,通过情感分析技术对每条留言进行情感计算,把学生留言以定量的方式表示其情感强度,设置强度阈值,达到阈值时,自动形成教师的评价摘要。
二、情感分析相关技术
情感分析又称意见挖掘(Opinion Mining),旨在利用计算机技术研究人们针对物体、个人、事件、主题及其属性的主观意见和情感,对文本的观点、情绪、情感极性做出判断。情感分析是自然语言处理领域的一个重要话题,旨在对无结构的主观性文本进行分析、处理和归纳,最终形成方便机器理解和用户使用的结构化数据。情感分析是一个多学科综合的领域,涉及语言学、统计学、心理学、机器学习、人工智能等领域的理论与方法。内容涉及多层语言分析技术,如分词、词性标注、命名实体识别、句法分析、社会网络构建等。
文本情感分析分为两个步骤,首先需要对文本来源进行处理,对文本进行主客观分类,从主客观混合的文本中将描述事实的客观性文本与表达意见的主观性文本区分开来,将主观语言的文本抽取出来,过滤掉不带情感色彩的文本。下一步是对主观性文本的分析,主要包括文本情感极性分析和文本情感极性强度分析。
由于学生评教的留言基本都为中文,中文文本的情感分析过程包括了分词、词性标注、情感词提取、情感词典的构建、情感极性判断等过程。 (一)中文文本的分词
中文分词是指将组成句子的汉字序列用分隔符加以区分,切分成一个个单独的词,它是中文文本处理的基础。经过学者们三十多年的研究和探索,中文分词已取得了长足的进步,分词的准确率得到大幅提高,特别是在使用了机器学习和基于统计的方法后,中文分词效果有了显著的进步。
本文采用第三代智能分词系统3GWS,3GWS是飞嘉华公司智能分词系列的产品,它是在继承优秀研究成果ICTCLAS自由源代码的基础上,综合统计方法、语义网络、模式推理与语言进化论等领域的最新研究成果。其主要功能有汉语智能分词、命名实体与新词识别、词性标注以及支持用户自定义词典。分词界面如图1所示。
(二)情感词抽取
情感词又称极性词、评价词语,特指带有情感倾向性的词。一般情感词有褒义和贬义两类极性。情感词抽取是情感分析的基础,因此引起了学者的广泛关注和研究。情感词抽取目前主要分为基于语料库和基于词典的两种研究方法。基于语料库的情感词抽取和判别主要是利用大语料库的统计特性,优点在于简单易行。基于词典的方法具有获取情感词全面、准确的优点,但是由于存在一词多义现象,构建的情感词典往往含有较多的歧义词。
本文提出了基于词性的情感词抽取方法,提取留言中所关心的词性,比如:形容词、副词、程度词;为了形成自动摘要,本文把相关名词和动词与进行提取,建立了关心词性表(见表1),表的内容可以根据不同领域自行增减。
(三)词语的情感极性
判别词语的情感极性是文本情感分析的基础,为了定量表示词语的情感程度,通常用[-1,1]之间的某个小数作为情感权重,来表示词语的褒贬程度。如果权重大于0,则表示词语为褒义词;情感权重小于0,则表示词语为贬义词。情感权重的绝对值越大则意味着词语的褒贬程度越大。
词语的情感极性判别主要有基于语料库和基于词典两种方法。基于语料库的方法主要是利用词语之间的连词以及统计特征来判别词语的情感极性。基于词典的方法是利用中文词典知网提供的语义相似度或者层次结构来判别词语的情感极性。
本文采用基于知网的情感极性标注方法,褒义词赋权为1,贬义词赋权为-1,程度副词按强度不同分别赋予2、1.5、0.8、0.5的权重,名词、动词赋权0,否定词为“-1”。
(四)留言的情感分析
在情感分析的典型应用中,产品评论的情感分析、新闻评论的情感分析、电影影评的情感分析被广大研究者所关注,这些研究具有一定的商业价值和社会价值。产品评论的情感分析主要任务是获取产品的特征或属性,定位用户的主观性评论,抽取评论词,判别用户评论的褒贬。新闻评论的情感分析是对评论人的评论进行挖掘,可以了解民众对新闻人物和新闻事件的总体评价,及时掌握当前的舆情信息,特别是热点事件的舆情信息,在舆情控制中起到了重要作用。
本文提出了基于表达式的留言情感分析方法,将褒义词、贬义词的运算符设置为“ ”,将程度副词的运算符设置为“*”。留言的情感褒贬强度计算公式为:
其中qi为情感词的权重,Ti为词的运算符,o为学生留言的词集合,“