Web3D环境中视觉问答的自然人机交互的方法研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:love_day
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着AI技术的发展,现如今的人机交互技术已经不再是传统的鼠标键盘交互,加入AI、VR已成未来之趋势。目前,AI交互技术在教育得到了广泛应用,从语音交互、视觉交互等技术的慢慢发展与应用过程中,多模态交互技术已成刻不容缓之势。视觉问答是将一个图像和一个相关的问题输入到机器中,然后得到正确答案作为输出的一种任务。将视觉问答(VQA)技术融入到教育中进行智能交互,是接来下研究的方向。幼儿图画教育主要分两个方面理性认知和感性认知两个方面,理性认知包括对于物体的数量、颜色、位置、物体等基础认知功能的提升,感性认知是对于图画中情绪感知能力的提升。因此幼儿阶段的图画训练可以率先为视觉问答技术与教育的结合提供一个很好的试验环境。基于以上分析,本文针对幼儿教育中的基础认知能力和情感感知能力培养引入了视觉问答技术。输入的图像和问题都来自于VQA-abstract剪贴画数据集以及与本文实现的Web3D问答场景风格一致的自制三维数据集,这与幼儿教学中的图画书内容相仿。由此,本论文基于联合嵌入的VQA模型思想,在不影响VQA模型原始性能的情况下,增加了情感检测器,组合成新的情绪视觉问答网络,该网络与普通VQA模型有所不同,将问题和情连接为一个句子,再将图像,问题进行联合嵌入,最后利用分类器处理特征。实验结果表明,本论文的模型通过在答案中加入情感信息,丰富了对图像的分析和理解,同时仍能保持当前普通VQA baseline模型范围内的准确性水平。最后,本论文将此视觉问答算法导入到构建好的Web3D教育平台中,使用MVVM模式对平台应用的数据、模型、视图进行分层,形成了模块化的框架总体架构,具体达到了虚拟课堂所必须的界面组件和功能模块。该平台可以评估孩子们在多大程度上能够通过3D场景图片进行概括。同时,该平台还提供一个交互框架,基于WebGL和three.js技术,让孩子在虚拟3D机器人的陪伴下进行相关图画的学习。该Web3D交互设计在结构层次上也有着有不同的细节,以提高幼儿图画的基础认知能力和情绪感知能力。
其他文献
随着天然气凝液回收的目标产品不同,衍生了不同的处理工艺。以HSZ气田气体性质作为基础数据,针对低压天然气,分别模拟计算了以乙烷和液化石油气两种主要产物的工艺过程。天然
镁合金作为可工程化应用最轻的金属结构材料,具有比强度、比刚度高,切削加工性能优良,导热导电和电磁屏蔽性能优越和环境相容性良好等优点,在汽车、通讯电子等领域有着广阔的
快速的城镇化发展导致建筑及其拆除的废弃物以每年数十亿吨的规模增长,传统的处理废弃物的方法是仅仅将其进行简单的堆埋,不仅占有宝贵的土地资源,还会对环境造成一系列的污
目前,多目标跟踪技术已经广泛的应用在我们生活中的各个方面。多目标跟踪任务涉及的场景具有复杂性:存在目标的进入和消失、目标被频繁遮挡等现象。多目标跟踪算法运行时会由
有机污染物的植物角质层-水分配系数(Kcw)对评价其植物累积和潜在风险具有重要意义。由于有机污染物和植物的种类繁多,采用实验方法逐一测定其Kcw耗时且成本高昂,目前为止,仅
我国的雾霾研究大都是从2011年美国大使馆公布Pm2.5数据之后开始的。近年来雾霾在华北地区呈辐射性扩散。我国长三角地区也属于雾霾重度污染地区。只要空气回暖气压降低,就会
湖泊是最重要的淡水资源之一,具有调洪蓄水、提供生态栖息地、净化环境等多种功能。随着人类社会经济活动和水资源开发强度的加剧,湖泊生态安全问题愈发严重。因此,开展湖泊
高校社团是大学生进行自我教育、自我发展的重要平台,蕴含着丰富的组织教育资源。思考大学生在高校社团中的组织公民行为问题,一方面有益于高校社团建设本身,同时,也能丰富组
Streptococcus thermophilus作为一种重要的食品发酵剂,被广泛地应用于发酵乳和奶酪等食品工业生产中,其次级代谢产物胞外多糖(Exopolysaccharide,EPS)更是一种天然的质地改
牛樟芝Antrodia camphorata为台湾特有真菌,具有抗菌、抗癌、抗炎等多种药理活性。先前研究表明,野生牛樟芝中含有多种麦角甾类化合物,而固体培养牛樟芝中是否具有该类化合物