全景图片自由浏览模式下基于眼动追踪数据的情绪分析与识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ZF6VE5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着5G和VR(Virtual Reality)的发展,基于全景内容的应用受到广泛关注。研究用户对于全景内容的感知和情绪反应对多媒体处理和用户体验质量评估至关重要。眼球的运动特征在不同全景内容情绪刺激下会发生显著变化,且眼动监测具备便捷、真实的特点,在情绪识别研究领域备受关注。当前基于全景内容诱发下眼动监测的情绪识别研究存在以下问题:(1)全景内容下带有情绪标签的眼动数据集较少,相关研究常利用头动代替眼动数据;(2)研究表明二维内容下眼动和情绪存在联系,但三维全景诱发态眼动模式与二维静态内容并不同,全景图片自由浏览模式下如何提取眼动特征并分析眼动偏差与情绪关系亟待研究;(3)以往研究多基于原始眼动数据,缺乏眼动行为特征分析,也未能充分挖掘眼动序列时序关联信息。针对以上问题,本文进行了如下工作:(1)基于LS2N实验室创建的全景图片-显著性数据集,选择刺激素材并建立了一个包含情绪标签(积极、中性、消极)的360度全景图片-情绪-眼动数据集,包含基于HTC Vive头显和SMI Eye-tracker设备记录的19位受试者自由头动和眼动数据。(2)根据虚拟现实头显的交互特点,本文提出了全景图片自由浏览模式下的眼动追踪数据处理框架,利用视口映射以及基于时间和速度阈值的方法提取眼动行为特征。经过ANOVA分析和Dunn多重比较分析表明在三维自由浏览模式下消极图片得到的凝视点比中性图片少,这与静态图片观察结果存在差异,推断全景图片引起的不适感会带来更多的回避眼动行为,具体表现出更长更大更快的扫视。(3)本文对不同算法模型和不同眼动特征的情绪三分类进行了充分实验,并验证了眼动行为特征的有效性。其中使用SBFS-GBDT方法在积极消极场景二分类实验中能获得79.12%的准确率,优于传统方法。(4)利用眼动序列相互依赖特性,构建基于眼动扫描路径的GRU(Gated Recurrent Unit)算法,采用切分序列方法,有效利用上下文信息,在积极消极二分类中较先前算法能提升2.4%,验证了算法的优越性。本文进行了全景图片下基于眼动的情绪分析与识别研究工作,所构建数据集和算法为为未来研究提供参考,并可能推动全景内容下基于眼动情绪识别的发展。
其他文献
在工业制造领域中,对工件的测量效率和测量精度的要求越来越高,一种由工业机器人和三维激光扫描测头集成的三维扫描测量机器人被逐渐广泛使用。在三维扫描测量机器人中采用测
近年来,随着汽车数量的不断增加,交通事故频繁发生,这给国家和个人带来了巨大的财产损失。目前,研究表明疲劳驾驶是造成严重交通事故的重要原因之一,世界各国法律法规中都明
随着机器视觉技术的快速发展,三维重建技术成为一种工业上物体形貌测量的重要手段。对于弱纹理物体的三维重建,传统方法难以匹配到足够的特征点,导致重建不完整。因此针对视
行人检测是指在给定的图像或视频中,将行人从背景中识别出来。行人检测有着广泛的现实意义,可以应用到各种实际生活场景,如监控系统和自动驾驶。近年来,深度学习特别是卷积神
随着大数据、人工智能新技术为代表的新的信息技术的应用,信息技术推动了业务信息化地不断发展,现代图书馆基本告别以前人工登记借还的传统手段,应用上了图书信息化系统进行
本文是在对所选取材料进行翻译的过程中得出的批评性赏析。本文选取的翻译材料是英国埃及学学者托比·威尔金森的作品《古埃及兴衰录》第四部分的第15章至第16章,该书出版于2011年。该部分描绘的是古埃及第十九至第二十王朝,也就是广义上的拉默塞德时期,也是古埃及的兴衰史上重要的转折点。在功能对等理论指导下,译者在翻译实践中采取了音译、词性转换、增译、拆分和重组翻译方法。本文从四个方面展开论述:即对原文的介
滚动轴承能够减少运动部件之间的摩擦使机器有效运转,已成为旋转机械的重要部件。据统计,滚动轴承失效是导致旋转机械故障的重要因素[14]。如何及时准确识别滚动轴承故障已成
在我国区域经济一体化发展的大背景下,研究都市圈市场一体化既是参与全球竞争合作的客观要求,也是应对区域经济一体化的必然选择。上海都市圈、南京都市圈和杭州都市圈作为长
随着时代的进步,人们对衣着的追求不再只是关注款式,更加注重衣着面料的手感和风格。面料设计者希望通过织物的结构参数快速了解织物的风格,从而简化设计步骤。本文通过对不
本文以奥威尔的政治寓言小说Animal Farm为研究对象,采用语料库手段对傅惟慈和孙仲旭在翻译英语复数第一人称代词“we”和“us”时所采用的翻译策略与方法进行分析,旨在总结