论文部分内容阅读
什么是信息可视化?
由于在线教育的迅猛发展,信息可视化在最近的几年中取得了快速的增长,该学科起源于20世纪80年代后期,当时的目的是使用计算机进行人机交互、图像显示,以加强对数据具体特征的理解。在关于信息可视化的众多定义中,大家比较接受的是Card等人提出的定义:信息可视化(IV)就是“通过计算机的支持与交互作用,将抽象的数据进行可视化描述以增强认知”。根据这个定义,有四项内容是理解这一领域的关键:可视化描述、交互作用、抽象数据、认知增强。
1.可视化描述
在现实中,我们常常试图通过使用图形来理解一些现象和数据,如当人们需要寻找城市中的一条街道、了解股票市场在某一时期的走势、查看天气预报时,此时使用图形要比使用文字更容易让人理解。例如,图1中显示了一列数字和一些长条,这些长条的长度与左边对应的数字成正比例,假设我们要找到数字中的最大值和最小值,如果没有右侧的长条,我们就要耗费更多的时间才能得出结论。
与文字或表格相比,数据的图形化显示利用了人的视觉感官优势,感官有着强大的能量,它可以将大量的信息传递到我们的头脑中,使我们能够辨识出重要的特征,并做出重要的推断。
2.交互作用
目前,性能优越、价格低廉的图形计算机已经普及,通用个人计算机已全面进入了图像化时代。同时,急剧膨胀的日常活动信息需要人们去处理,这就需要科学家利用使用者与算法交互的可能性来探索在计算机上显示海量数据的新方式。
3.抽象数据
数据本身可以有多种形式,但我们只能辨别出具有物理对应关系的数据,如空气的湿度、黄金的密度等,除了这些还存在着具有抽象性质的数据,如股票市场的波动、未来7天的气温走势。我们也希望可以用图像的方式对这些抽象的数据进行直接观测,这样的需求就促使了信息可视化的产生,其显著特点是处理非结构化的数据集。
4.认知增强
图形可以以多种方式辅助思考与理解。例如,我们进行37×73这一乘法运算时,心算比使用纸笔计算的时间要长5倍,这一操作的困难在于需要在记忆中暂存两个数相乘的部分结果直到它们被使用(如图2)。
这个例子显示出可视化手段或工具对认知能力的增强,它向我们头脑中传递信息,并使我们搜寻与之匹配的模式,识别出它与数据之间的关联,从而更容易地进行推断。
信息可视化的优势
信息可视化的基本原理就是将数据以图形的形式进行展示,并利用人的感官能力对其进行解读。图形展示可以帮助我们对复杂庞大的数据集进行描述和理解,正如Larkin和Simon在他们的开创性论文《一图抵千言》中所说,图形展示的这种效果是因为它们具有良好的空间清晰度,基于这个空间清晰度,再对数据进行良好的图形化展示,这就能提高人们理解内容的效率。Larkin和Simon对比了物理问题中使用图表计算和语句计算的效率,认为图表在以下三个基本方面具有优势:①通过将要使用的信息聚集在一起实现了信息定位;②通过使用信息定位将单一元素的信息编组实现了标签最小化;③通过支持大量的、人们易于接受的感知推理来实现感知强化。这不仅避免了对不同信息的大量搜寻,还可以将需要同时处理的不同的信息紧密地定位在一起。例如,图3描绘的是马德里地铁运输系统的局部线路图,通过将地铁线路和站名放在同一张地图中实现了信息定位原理的应用,乘客可以在图中方便地查找到线路、交汇、站点等信息。如果一位乘客想要从San Bernardo出发到达Cristal,他可以找到多种不同的换乘线路组合,而且能够大致确定哪条换乘线路组合用时最短。
信息可视化中的一个关键问题是我们如何将抽象数据转化为图形,这个图形既要保留基本数据的意义,同时还要有新的观点。研究者对原始数据进行图形化构建,在这一过程中没有万能公式可用,因此,面对不同的数据性质、不同的信息类型,图形化展示的设计者需要更多地发挥自己的创造力。
教育软件中的可视化
在網络学习平台上应用图形展示可以帮助教师了解学生的状况,同时可以监测学生的行为。下面,我们将对两种类型的应用,即用户模型的可视化、学生行踪数据的可视化展开介绍。
1.用户模型的可视化
用户模型是对一组用户信息集合的描述,其中特别关注他们在不同领域的知识、学习动机及兴趣偏好等。学生模型是智能教育系统中的关键元素,它用来描述学生对教学材料的了解程度。目前,在教育系统中开发了许多为用户建模的方法,开发的这些模型增进了软件的个性化,尤其是在网络上,用户模型是用来生成个性化网站的一组信息集合。下面介绍一种用户模型的可视化工具——E-KERMIT。
KERMIT是一种基于知识的智能关系建模指导系统,它的功能是为大学生教授概念数据库的设计。KERMIT以“提出需求-完成需求”的方式进行教学,它首先向学生展示出对数据库的需求,然后学生根据需求设计相应的“实体-关系(ER)”表格完成数据库建模。Hartley和Mitrovic在KERMIT的基础上对其进行扩展,开发出了E-KERMIT,在E-KERMIT中,教师可以使用专门的界面查看学生模型的全局视图(如下页图4)。图中对课程内容按照类别进行了划分,展示出了ER建模的过程和概念,在开放学生模型的展示中,课程内容的概念使用柱状图形进行绘制,黑色的柱状图显示学生已经掌握的课程内容,白色的柱状图显示学生未掌握的课程内容,并在图中标示出了在这个类别的概念掌握上所占的百分比。例如,在图4中的“结构”这一类别上,学生学习过的内容占47%,掌握的内容占35%,那么,他在该类别上的得分就为74.5(35/47×100)。 2.学生行踪数据的可视化
在最近的几年涌现出了许多软件平台,平台上的课程管理系统(CMS)是用来对远程学习提供支持的,该系统可以帮助教师发布信息、制作内容材料、布置作业、准备测试、参与讨论,课程管理系统以日志的形式累积记录了大量的追踪信息,这些信息可以监控学生的行为,但是这些文本形式的日志文件并不适宜直观访问,这就很难满足教师的需求。而信息可视化技术与工具则可以将日志中的大量信息进行可视化展示,从而为教师提供更加直观、快速的参考。
最近,一些研究者开发出了许多图形化展示工具用于分析学生行为数据,这里仅对其中一种做介绍。CourseVis是一个能够将课程管理系统(CMS)中的数据进行图形化展示的工具,它为教师查看学生的交往、认知、行为等方面的情况提供了支持,CourseVis首先进行系统的调查以查找教师想要了解的内容,并确定获得这些信息的可行方式。在进行系统调查时,首先要制作调查表,然后根据调查结果形成需求,并进行图形化展示的设计。图5显示了一个使用CourseVis生成的图形化展示案例。该图在二维平面空间上显示,横轴描绘的是课程日期,在纵轴方向上对应许多变量,表示的是课程的具体内容信息,该图展示的是学生对内容页面的访问、对课程的总体访问和课程的进度。
教师可以通过这张图表辨别需要特殊关注的学生个体,发现学生在某一内容知识上是否遇到困难,然后有针对性地对难点知识进行细致讲解。
结论与将来工作
在线教育系统聚集了大量的信息,这对分析学生的行为具有很大的价值。然而,由于这些系统产生的数据量十分庞大,使用手工方式很难处理,在过去的几年中,研究者开始着手探索利用各种方法从中提取有价值的信息,以幫助教育者管理课程。数据挖掘与信息可视化是两种可以用来从学生的使用数据中发现有用信息的方法,在本文中,我们展示了使用IV技术的一些想法和原理,利用IV技术可以将学习网站中搜集的信息以图形的方式呈现出来。借助视觉感知能力,我们可以通过图形化迅速展示发现数据的模式、规律、趋势,还可以对数据集形成一个总体的概览。另外,我们描述了一些使用了可视化的学习系统,用以描绘用户模型数据、行踪数据,从中可以认识到单独使用数据挖掘算法是不够的,同样,单独使用图形化展示来分析复杂、庞大的数据集也并不是最有效可行的,而将数据挖掘和信息可视化两种方法组合使用才能够创建出具有更加强大功能的工具,未来的研究也一定会考虑两种方法的联合开发。
由于在线教育的迅猛发展,信息可视化在最近的几年中取得了快速的增长,该学科起源于20世纪80年代后期,当时的目的是使用计算机进行人机交互、图像显示,以加强对数据具体特征的理解。在关于信息可视化的众多定义中,大家比较接受的是Card等人提出的定义:信息可视化(IV)就是“通过计算机的支持与交互作用,将抽象的数据进行可视化描述以增强认知”。根据这个定义,有四项内容是理解这一领域的关键:可视化描述、交互作用、抽象数据、认知增强。
1.可视化描述
在现实中,我们常常试图通过使用图形来理解一些现象和数据,如当人们需要寻找城市中的一条街道、了解股票市场在某一时期的走势、查看天气预报时,此时使用图形要比使用文字更容易让人理解。例如,图1中显示了一列数字和一些长条,这些长条的长度与左边对应的数字成正比例,假设我们要找到数字中的最大值和最小值,如果没有右侧的长条,我们就要耗费更多的时间才能得出结论。
与文字或表格相比,数据的图形化显示利用了人的视觉感官优势,感官有着强大的能量,它可以将大量的信息传递到我们的头脑中,使我们能够辨识出重要的特征,并做出重要的推断。
2.交互作用
目前,性能优越、价格低廉的图形计算机已经普及,通用个人计算机已全面进入了图像化时代。同时,急剧膨胀的日常活动信息需要人们去处理,这就需要科学家利用使用者与算法交互的可能性来探索在计算机上显示海量数据的新方式。
3.抽象数据
数据本身可以有多种形式,但我们只能辨别出具有物理对应关系的数据,如空气的湿度、黄金的密度等,除了这些还存在着具有抽象性质的数据,如股票市场的波动、未来7天的气温走势。我们也希望可以用图像的方式对这些抽象的数据进行直接观测,这样的需求就促使了信息可视化的产生,其显著特点是处理非结构化的数据集。
4.认知增强
图形可以以多种方式辅助思考与理解。例如,我们进行37×73这一乘法运算时,心算比使用纸笔计算的时间要长5倍,这一操作的困难在于需要在记忆中暂存两个数相乘的部分结果直到它们被使用(如图2)。
这个例子显示出可视化手段或工具对认知能力的增强,它向我们头脑中传递信息,并使我们搜寻与之匹配的模式,识别出它与数据之间的关联,从而更容易地进行推断。
信息可视化的优势
信息可视化的基本原理就是将数据以图形的形式进行展示,并利用人的感官能力对其进行解读。图形展示可以帮助我们对复杂庞大的数据集进行描述和理解,正如Larkin和Simon在他们的开创性论文《一图抵千言》中所说,图形展示的这种效果是因为它们具有良好的空间清晰度,基于这个空间清晰度,再对数据进行良好的图形化展示,这就能提高人们理解内容的效率。Larkin和Simon对比了物理问题中使用图表计算和语句计算的效率,认为图表在以下三个基本方面具有优势:①通过将要使用的信息聚集在一起实现了信息定位;②通过使用信息定位将单一元素的信息编组实现了标签最小化;③通过支持大量的、人们易于接受的感知推理来实现感知强化。这不仅避免了对不同信息的大量搜寻,还可以将需要同时处理的不同的信息紧密地定位在一起。例如,图3描绘的是马德里地铁运输系统的局部线路图,通过将地铁线路和站名放在同一张地图中实现了信息定位原理的应用,乘客可以在图中方便地查找到线路、交汇、站点等信息。如果一位乘客想要从San Bernardo出发到达Cristal,他可以找到多种不同的换乘线路组合,而且能够大致确定哪条换乘线路组合用时最短。
信息可视化中的一个关键问题是我们如何将抽象数据转化为图形,这个图形既要保留基本数据的意义,同时还要有新的观点。研究者对原始数据进行图形化构建,在这一过程中没有万能公式可用,因此,面对不同的数据性质、不同的信息类型,图形化展示的设计者需要更多地发挥自己的创造力。
教育软件中的可视化
在網络学习平台上应用图形展示可以帮助教师了解学生的状况,同时可以监测学生的行为。下面,我们将对两种类型的应用,即用户模型的可视化、学生行踪数据的可视化展开介绍。
1.用户模型的可视化
用户模型是对一组用户信息集合的描述,其中特别关注他们在不同领域的知识、学习动机及兴趣偏好等。学生模型是智能教育系统中的关键元素,它用来描述学生对教学材料的了解程度。目前,在教育系统中开发了许多为用户建模的方法,开发的这些模型增进了软件的个性化,尤其是在网络上,用户模型是用来生成个性化网站的一组信息集合。下面介绍一种用户模型的可视化工具——E-KERMIT。
KERMIT是一种基于知识的智能关系建模指导系统,它的功能是为大学生教授概念数据库的设计。KERMIT以“提出需求-完成需求”的方式进行教学,它首先向学生展示出对数据库的需求,然后学生根据需求设计相应的“实体-关系(ER)”表格完成数据库建模。Hartley和Mitrovic在KERMIT的基础上对其进行扩展,开发出了E-KERMIT,在E-KERMIT中,教师可以使用专门的界面查看学生模型的全局视图(如下页图4)。图中对课程内容按照类别进行了划分,展示出了ER建模的过程和概念,在开放学生模型的展示中,课程内容的概念使用柱状图形进行绘制,黑色的柱状图显示学生已经掌握的课程内容,白色的柱状图显示学生未掌握的课程内容,并在图中标示出了在这个类别的概念掌握上所占的百分比。例如,在图4中的“结构”这一类别上,学生学习过的内容占47%,掌握的内容占35%,那么,他在该类别上的得分就为74.5(35/47×100)。 2.学生行踪数据的可视化
在最近的几年涌现出了许多软件平台,平台上的课程管理系统(CMS)是用来对远程学习提供支持的,该系统可以帮助教师发布信息、制作内容材料、布置作业、准备测试、参与讨论,课程管理系统以日志的形式累积记录了大量的追踪信息,这些信息可以监控学生的行为,但是这些文本形式的日志文件并不适宜直观访问,这就很难满足教师的需求。而信息可视化技术与工具则可以将日志中的大量信息进行可视化展示,从而为教师提供更加直观、快速的参考。
最近,一些研究者开发出了许多图形化展示工具用于分析学生行为数据,这里仅对其中一种做介绍。CourseVis是一个能够将课程管理系统(CMS)中的数据进行图形化展示的工具,它为教师查看学生的交往、认知、行为等方面的情况提供了支持,CourseVis首先进行系统的调查以查找教师想要了解的内容,并确定获得这些信息的可行方式。在进行系统调查时,首先要制作调查表,然后根据调查结果形成需求,并进行图形化展示的设计。图5显示了一个使用CourseVis生成的图形化展示案例。该图在二维平面空间上显示,横轴描绘的是课程日期,在纵轴方向上对应许多变量,表示的是课程的具体内容信息,该图展示的是学生对内容页面的访问、对课程的总体访问和课程的进度。
教师可以通过这张图表辨别需要特殊关注的学生个体,发现学生在某一内容知识上是否遇到困难,然后有针对性地对难点知识进行细致讲解。
结论与将来工作
在线教育系统聚集了大量的信息,这对分析学生的行为具有很大的价值。然而,由于这些系统产生的数据量十分庞大,使用手工方式很难处理,在过去的几年中,研究者开始着手探索利用各种方法从中提取有价值的信息,以幫助教育者管理课程。数据挖掘与信息可视化是两种可以用来从学生的使用数据中发现有用信息的方法,在本文中,我们展示了使用IV技术的一些想法和原理,利用IV技术可以将学习网站中搜集的信息以图形的方式呈现出来。借助视觉感知能力,我们可以通过图形化迅速展示发现数据的模式、规律、趋势,还可以对数据集形成一个总体的概览。另外,我们描述了一些使用了可视化的学习系统,用以描绘用户模型数据、行踪数据,从中可以认识到单独使用数据挖掘算法是不够的,同样,单独使用图形化展示来分析复杂、庞大的数据集也并不是最有效可行的,而将数据挖掘和信息可视化两种方法组合使用才能够创建出具有更加强大功能的工具,未来的研究也一定会考虑两种方法的联合开发。