表情分析技术在可用性评估中的应用研究——以FaceReader软件为例

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:chouser1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可用性评估中的表情分析是指对用户在使用产品过程中引发的表情进行直接测量和分析。这种方法具有直接性和实时性的优点,对传统产品可用性评估方法如专家评估、绩效测试是一种重要的补充。近年来,国内外越来越多的研究者开始探讨表情分析方法在可用性评估中的应用性。本研究以FaceReader软件为例,首先通过标准表情库考察了该软件在中国人脸表情的识别有效性,然后以其作为表情分析工具,通过实验室实验方法,探讨了表情指标应用于软件产品可用性评估中的有效性。从而为研究者在可用性评估中采用表情分析指标的实践提供科学依据。  本论文研究共包括两个部分,具体如下:  研究一:考察FaceReader表情分析软件对中国人脸表情的识别有效性  该部分研究主要采用USTC-NVIE标准表情数据库中的人为表情图片、自发表情图片以及通过标准化情绪引发刺激诱发的动态表情等三类表情刺激,通过比较FaceReader表情分析软件与人类评估者对三类表情刺激在表情类型识别率以及识别强度结果之间的一致性,来考察FaceReader表情分析软件对中国人脸表情的识别有效性。  首先,在分别对人为表情图片和自发表情图片进行标准化筛选的基础上,比较了FaceReader表情分析软件与人类评估者在各表情类型的识别率和识别强度上的一致性。  然后,针对表情视频,先使用标准化的情绪引发刺激收集表情视频材料,再分别比较FaceReader与被试自我报告、FaceReader与人类评估者在各表情类型的识别率和识别强度上的一致性。  研究二:表情分析指标应用于软件产品可用性评估中的有效性研究。  该部分研究主要通过实验室方法,考察了表情分析指标在比较两款同类软件产品(音乐播放器软件)的可用性水平,以及同一款软件产品在界面优化前后的可用性水平上的应用有效性。  实验1中采用典型任务操作法,比较了被试使用两款不同可用性水平的同类软件产品(两款典型的音乐播放器)完成典型操作任务时的绩效指标(操作时间、正确率)、主观评价(SUS量表评分)和表情分析的结果,并通过对表情分析结果与其它主客观评价指标进行了比较,来考察表情分析指标应用于比较不同软件可用性水平的有效性。  实验2在实验1的基础上,首先根据可用性设计原则对可用性较差的音乐播放器软件进行改进和优化,然后再通过比较被试在使用同一款软件改进前后版本完成典型操作任务时的绩效指标(操作时间、正确率)、主观评分(SUS量表评分)和表情分析结果,并通过对表情分析结果与其它主客观评价指标进行比较,来考察表情分析指标应用于比较单个软件改进前后可用性水平的有效性。  本研究结果表明:  (1)FaceReader软件对中国人脸表情具有较好的识别和分析能力。对人为表情图片来说,FaceReader可以对71%的图片进行正确分类,对“悲伤”、“高兴”、“惊奇”、“厌恶”、“中性”的图片,FaceReader与人类评估者的表情强度判断结果存在显著相关。  (2)对自发表情图片来说,FaceReader可以对70.6%的图片进行正确分类,对“悲伤”、“高兴”、“惊奇”、“生气”、“厌恶”的图片,FaceReader与人类评估者的表情强度判断结果存在显著相关。  (3)对表情视频来说,FaceReader与被试自我报告相比的分类正确率达32%,对“中性”、“高兴”、“悲伤”表情可以识别,对“厌恶”、“生气”、“害怕”表情未能识别,对“中性”、“高兴”、“悲伤”的表情视频,FaceReader的识别强度与被试自我报告结果存在显著相关;FaceReader与评估者结果相比的分类正确率达53%,对“中性”、“高兴”、“悲伤”表情识别率较高,对“厌恶”、“生气”、“害怕”表情识别率较低,对“中性”、“高兴”、“悲伤”的表情视频,FaceReader的识别强度与人类评估者结果存在显著相关。  (4)对于同类软件的两款可用性水平不同的产品来说,相对于可用性水平较高的产品,可用性水平较差的产品不但操作时间更长,正确率更低,负性表情成分更多,SUS评分更低,且表情强度与SUS评分在“悲伤”、“生气”等负性表情成分上出现显著负相关。而正性表情成分指标相对来说较难反映同类型的不同软件产品的可用性水平。  (5)对于同一款软件改进前后的不同版本产品来说,类似于不同软件产品的实验结果,相对于改进后可用性水平较高的产品,可用性水平较差的改进前产品不但操作时间更长,正确率更低,负性表情成分更多,SUS评分更低,且在表情强度上,SUS评分与“悲伤”、“生气”、“惊奇”等负性情绪成分间存在显著负相关。而正性表情成分指标相对来说没有显著差异。
其他文献
情感计算(Affective Computing)是一种赋予计算机情感识别能力的交互计算方法。情感计算是人工智能领域的研究热点,其目的是让人工智能更好地为人类服务。  在情感识别中,计
“2010(银川)国际墙体屋面材料技术交流大会暨第13届生产装备博览会”已于7月5日在银川国际会展中心成功落下帷幕.本届博览会规格高、规模大、参会人数多、内容丰富,收到了良
目前,我国基础教育课程改革正向纵深发展。作为基础教育重要组成部分的小学和初中英语教学,则面临着新的机遇和挑战。新课程改革对小学和初中英语教学提出了更高要求,而小学和初
对原系统中存在的夏季排气压力超标、噪声高,冬季吸气压力偏低等问题进行分析,采取相应改造措施。工程改造结果表明:在石家庄地区的中小规模建筑中,夏季选用风冷式冷水机组配以蒸
如今,跨文化交际越来越受到人们的关注。进行成功的跨文化交际不仅需要人们具备出色的语言能力,还要了解文化间的差异并能在交际中灵活运用。因此,高中英语新课程标准中强调要培
目前,我国的高职院校得到了快速发展,而高职院校中有相当一部分是由中专升格而来,这类学校的专业教师作为其师资队伍的中坚力量,面临学校升格带来的诸多挑战。只有教师的顺利转型
学位
学位
“工作”特性作为视觉工作记忆的主要特征,近年来受到越来越多研究者的关注,逐渐成为视觉工作记忆领域的研究热点之一。前人关于视觉工作记忆信息操纵的研究均集中在对存储在视
随着积极心理学的发展,工作投入作为工作倦怠的对立面,一直受到研究者和实践者的青睐。大多数研究者从资源的角度出发,基于工作要求-资源模型,探讨提升工作投入的方法。工作重塑