反转学习环境下猕猴自信与学习过程的研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:xyxyxyxyxy999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类和动物在生存的过程中,无时无刻都在面对复杂多变的环境。因此学习就成为在不确定的环境中生存的重要能力。学习不仅是决策和反馈之间建立联系的过程,也有许多高级认知过程参与到学习之中,例如元认知。自信作为元认知的可测量指标之一,已有大量以人类为对象的研究证实自信在学习过程中起着重要作用。但是在其他物种中,自信是否参与到学习过程中,甚至在其他物种中元认知是否存在均仍在探讨之中。在本研究中,我们使用一种创新的适用于动物的时间赌注自信范式,结合经典的反转学习范式,对猕猴的学习过程和伴随学习的自信变化进行研究。时间自信范式作为一种新颖的自信范式,目前仅主要应用于啮齿类的研究中。本研究目标之一旨在通过将时间自信范式拓展至猕猴研究中,以探究这一自信范式在非人灵长类上的有效性。另外的研究目的是通过构建逻辑回归模型以及强化学习模型对数据进行分析,多方面地探讨猕猴的自信与学习的关系,以及在不同环境下猕猴行为的改变。研究发现:第一,与已有的啮齿类研究类似,我们的结果指出,猕猴在反转学习过程中表现出高自信试次的正确率更高。并且表现出正确试次的等待时间长于错误试次,这表明了时间自信范式在非人灵长类上、以及在反转学习范式上的能够有效的测量自信。第二,根据逻辑回归的拟合结果,我们发现等待时间对于猕猴反转学习的决策无统计意义上的显著的线性影响,这一定程度上说明该范式下等待时间可能反映了更高阶的认知过程的参与。并且进一步的分析发现了猕猴的等待时间与模型估计的选择确信程度存在显著的线性相关,进一步说明了时间自信范式中的等待时间能够一定程度上反映了选择时的确信程度。第三,我们继续探讨了猕猴在反转学习过程中其行为受奖励、环境不确定程度的影响而发生的变化。我们通过对比三个基础强化学习模型,发现了猕猴在反转学习过程中,其学习效率、探索性行为在不同的环境确定程度下存在不同的改变。第四,我们创新性地构建了一种全新的基于自信的动态学习率强化学习模型,并通过与最优基础模型对比,提供了在此范式下猕猴使用等待时间所表达的自信参与学习过程的证据。并且根据我们的假设提出了等待时间与学习率之间可能存在的映射关系。综上,本研究在非人灵长类反转学习环境下验证了时间自信范式的有效性,同时,通过构建创新性的强化学习模型为后续时间自信范式研究中自信的量化提供了一定研究方向以及为强化学习模型的构建提供了新的思路。另外,研究结果提示了猕猴反转学习过程中存在自信等更为高级的认知过程的参与,填补了现有元认知与学习领域中的跨物种研究的空缺。
其他文献
惩教改造和心理与社会项目旨在为罪犯提供生存技能和知识,使其能够在刑满获释后重新融入社会。然而,目前只有长期罪犯受益于惩教改造,短期罪犯没有接受相关教育,没有受益的罪犯刑满释放后会继续犯罪,这不禁令人质疑纳米比亚惩教计划的有效性。本研究旨在调查纳米比亚惩教计划实施的有效性,主要针对两个机构,目的是调查和确定罪犯惩教改造课程的有效性,实施的惩教计划是否能让罪犯为重新融入社区做好准备,评估惩教课程的实施
学位
阿尔喀比亚德是古希腊时期雅典的著名将领之一,这一杰出英雄却因复杂的德性、难以抑制的野心、多次叛国行为而备受争议,最终酿成个人悲剧,而其行动亦深切影响着伯罗奔尼撒战争的走向及参战各方的命运。因而古今众多文史家都对他表现出浓厚兴趣,在各类著作中对其加以塑造或解释,其中最重要的文本包括修昔底德的《伯罗奔尼撒战争史》、柏拉图的《阿尔喀比亚德》与《会饮》以及普鲁塔克的《希腊罗马名人对比列传》等。这些著作中所
学位
学前阶段是儿童大肌肉动作发展的关键期,目前已有研究中对城镇地区儿童大肌肉动作发展的研究较少。因此,研究4-6岁城镇儿童大肌肉动作发展的情况与特征,并探讨家庭运动环境中各维度对4-6岁城镇儿童大肌肉动作发展的影响情况,在此基础上提出相应的教育建议,改善4-6岁城镇儿童大肌肉动作的发展现状。本研究共有三个子研究。研究一采用TGMD-3量表对Y县4-6岁儿童的大肌肉动作发展情况进行评估。研究二主要对参与
学位
近年来,数据量的剧增对海量数据存储与高算力提出了更高的要求。“存储墙”和“功耗墙”的存在使得传统的冯·诺依曼(von Neumann)架构面临着严峻的挑战。相变存储器(phase change memory,PCM)因较快的读写速度、低的操作功耗和良好的CMOS工艺兼容性等优势,而获得关注。相变存储材料(phase change materials,PCMs)作为PCM存储信息的媒介与核心,其结构
学位
秘鲁-西班牙作家马里奥·巴尔加斯·略萨发表于2000年的长篇小说《公羊的节日》在主题和内容方面都表现出拉丁美洲独特的现实传统,因此带有强烈的民族志色彩。本论文试图从民族志叙事的角度对作品进行探究,着力分析民族志叙事形成的原因、呈现方式及民族意义,旨在说明民族志叙事不仅仅局限于民族内部,而也是可以具有世界性的普遍意义的。论文主要从三部分展开。绪论部分主要对作品的国内外相关研究情况进行综述,并阐明了本
学位
作为回应型法的典型,公司合规在美国过往60年的发展历程之中,从公司商业实践、政府规制到刑事制裁的分散源头,在1990年代汇集成为一个完整的制度。合规不仅仅是公司犯罪制度的升级,也是公司治理乃至公司理论在社会实践中演化的结果。两者之间的相互支持形成了今天的制度,但是这种互动演化仍然在进行之中,存在着诸多不同层面和视角的争议。中国已有的合规实践表明,由于整体制度尤其是法律制度中的基础性条件的缺乏,导致
期刊
合作是人类生存的一个必要条件,也是社会科学中长期存在的一个基本难题。在社会困境中,不合作会带来更高的个人利益,而合作会带来更高的集体利益与更高的被剥削的风险。在与陌生人的人际互动中,为了避免被剥削,个体会通过面孔性别二态性线索产生对对方合作性的判断,人们通常认为女性化特征反映了更高的合作水平,而男性化特征则相反。然而目前尚不清楚人们对于面孔性别二态性的合作性判断是否影响自身的合作行为。因此,本研究
学位
蕅益智旭(1599—1655)是明末四大高僧之一。《四书蕅益解》作为中国古代佛教高僧第一部全面解读儒家“四书”的传世名作,是蕅益智旭运用佛教理论对儒家“四书”进行系统诠释的理论成果。本文以其中的《论语点睛》为研究对象,深入辨析蕅益智旭在诠释《论语》中所体现出的理路。论文分为四个部分。第一部分即引言,该部分主要围绕着本文的研究意义、研究综述和研究方法等展开。第二部分即第一章,该部分主要简述《论语点睛
学位
情绪调节对个体的发展至关重要。随着年龄的增长,认知能力的成熟,个体的情绪调节方式也由外在行为取向的策略向内在认知取向的策略转变。因此,认知情绪调节策略逐渐受到人们的重视。除了受到生理基础、人格特征等因素的影响,父母和家庭对认知情绪调节的发展亦有重要意义。然而较少有研究探索父母对子女认知情绪调节的影响及其内在机制。而父母控制作为一种教养方式,是否会在认知情绪调节的代际传递过程中发挥作用,也值得进一步
学位
驿运是中国古代一种集通信与运输相结合的重要交通形式,在官办的运输系统中扮演着尤为重要的角色。随着时代的变迁,驿运亦在不断的发展变化,并先后融入新的历史文化元素,从而致使其内涵与外延均得以不同程度地扩充及完善。然而,进入近代以后,由于西力东渐的影响,新式交通工具不断涌现并越发多样化。而与之形成鲜明对比的是,依靠人力与畜力等自然力为主的传统驿运在现代化浪潮的不断冲击下,开始步入衰落的态势。是故,旧式与
学位