论文部分内容阅读
日常生活中人类即使完成最简单的任务,也必须与外部环境实现灵活的动态交互,譬如在拥挤的超市中前往特定的货架取下一袋奶粉,或是在篮球比赛中避开对手的阻扰,准确地将球传给队友。上述交互行为均以视觉系统对运动信息感知、理解和预测的能力为基础。强大的视觉加工能力或许可以通过基于丰富认知资源的大量计算加以实现(如人工智能中的强化学习和深度学习),然而数十年来的认知心理学研究表明,人类的认知资源极其有限,这意味着人类的视觉智能不可能通过大量复杂的运算来实现,而是需要以相对简单的运算处理丰富的信息。信息的运算极大地依赖于信息的表征方式(Marr,1982),因此,建立高效的信息表征是实现人类视觉智能的关键所在。运动客体并非独立存在于视觉场景中,而是与其他客体或背景具有紧密的联系,对运动信息的加工往往依赖于由相互联系的视觉对象整合而成的整体,因此视觉系统需要为运动信息构建具有整体结构的表征。在诸多可能的整体表征中,层级结构能够在不同的层级水平上描述运动对象,具有以简单形式表达丰富信息的特征,与视觉表征的核心需求高度契合(Xu,Tang,Zhou,Shen,&Gao,2017)。笔者据此假设,运动信息在视觉加工中以层级结构加以表征。本研究将心理物理学研究方法与计算建模的方法相结合,以三项研究共八个实验,测量运动信息潜在层级结构的变化对人类行为绩效的影响,并采用不同类型的计算模型模拟相同的任务过程,比较其模拟结果与人类行为模式的异同,旨在检验运动信息在视觉加工中是否存在层级表征,并进一步探讨其特征。主要结果如下:(1)运动信息潜在层级结构的变化影响被试的行为绩效,表明视觉加工中形成了对运动信息的层级表征。(2)视觉对运动信息的层级表征不受运动信息的时间长度、任务线索和任务目的的影响,具有跨情景的一致性。(3)带有社会信息的运动,同样能在视觉加工中以层级结构加以表征。(4)视觉对运动信息的层级表征具备因果性,不仅描述了运动的形式,同时描述了运动的产生过程。(5)视觉加工基于所构建的层级表征,通过逆向工程的计算完成对运动场景的识别、理解和预测。上述结果不仅为视觉加工中运动信息层级表征的存在提供了坚实的证据,同时揭示了该层级表征的稳定性和普遍性。此外,本研究的计算模型进一步模拟了视觉系统利用层级表征执行后续加工的过程,为现有人工智能系统向人类智能逼近提供了有益的尝试。