【摘 要】
:
常模(Norm)是将测验的原始分数(raw score)转化为有意义的量表分数(scale score)的工具或桥梁。常模质量的高低决定着人事选拔工作的成败。但要研发出高质量的常模,需要克服许多困难,接受许多挑战。这些挑战包括代表性不足、实证性不强、稳定性较差、平滑性不好和可比性欠缺等问题。其中,代表性不足指的是被试样本对目标总体的代表性不足、以及题目样本对测量内容全域或结构维度的代表性不足的问题
【机 构】
:
Educational Testing Service 北京师范大学心理学院,北京,100875
论文部分内容阅读
常模(Norm)是将测验的原始分数(raw score)转化为有意义的量表分数(scale score)的工具或桥梁。常模质量的高低决定着人事选拔工作的成败。但要研发出高质量的常模,需要克服许多困难,接受许多挑战。这些挑战包括代表性不足、实证性不强、稳定性较差、平滑性不好和可比性欠缺等问题。其中,代表性不足指的是被试样本对目标总体的代表性不足、以及题目样本对测量内容全域或结构维度的代表性不足的问题。实证性不强指的是很多人事测评量表没有收集到足够的、独立的和实证的效度证据问题,也包括没有有效利用典型行为样本来标定常模的单位和界定分数的范围等问题。稳定性较差是指因题目记分设计不当或问卷过短等问题而导致的信度太低、误差太大的问题。平滑性不好指的是常模出现了天花板效应、地板效应、分数突变、以及分数逆转等问题。可比性欠缺指的是分数之间没能实现等值或垂直链接的问题。针对这些问题,安格夫(Angoff, 1971,1984)曾从经典测验理论(Classical Testing Theory, CTT)的角度作过系统论述。后来,葛萨齐(Gorsuch,1983,1985) 从统计学的角度提出了"连续型常模"(Continuous Norming)的常模研发思路,该思路使得当代心理测量量表的研发水平上升到了一个崭新的高度。近年来,随着项目反应理论(Item Response Theory, IRT)的发展,居于IRT真分数等值方法的常模研发技术又有了新的进展。本文利用这些最新成果,探讨了应对常模研发中这些挑战的若干对策,为研发高质量的测验常模、提高人们鉴别量表质量的水平提供了一些建议。
其他文献
雨果说:“开展纪念活动,如同点燃一支火炬。”纪念日是指发生过重大事情值得纪念的日子。在生活中,有些事情,有些日子,我们是永远不应该忘记的,纪念的范围比较广泛,国家有纪念日,家乡有纪念日,家庭有纪念日,甚至我们个人也有纪念日。纪念日可以使我们不忘过去,永远牢记那些值得我们记忆的事情,更好地面对未来,去创造美好的明天。本文主要针对民俗纪念日的启动效应进行了研究。启动效应是指由于之前受某一刺激的影响而使
职业价值观(Work Values)这一术语由Super(1957)于20世纪50年代在他的职业发展理论(CareerDevelopment Theory)中提出,而培养良好的职业价值观对大学生成功就业具有重要意义。因此为了解当代大学生的职业价值观现状,研究者依据相关理论编制了大学生职业价值观问卷,对包括985院校、211院校和普通院校的全国30所大学的5000多名学生进行了大规模调查,以期全面深
心理疾病污名是对心理疾病患者的消极态度,是个体在社会互动中对心理疾病患者存有的负面评价、消极情感体验和歧视.与外显指标相比,内隐心理疾病污名能更好的预测个体自动化的行为以及心理健康从业人员对患者病情严重程度的评估.SEB( Stereotypic Explanatory Bias)测量是一种内隐态度的测量方法,主要用于测量被试不愿意报告或没有意识到的态度.与传统的态度的外显测量相比,SEB测量基于
目的:探讨当代青年男性在网络“泛性化”条件下对青年女性的内隐态度,以期让青年男性更客观的认识自己的看法,同时期望引起网络媒体的关注,给网络媒体提出合理的有关网络泛性化的建议.方法:通过考虑上网时间,有没有女朋友或者是否曾经交过女朋友等因素,从山东某两所高校选择每天上网时间相当以及现在或曾经有过女朋友的的大一到大三的40名学生,学生年龄在19-25岁之间,对其进行进行内隐联想测验,测验通过调查选定的
为考察当前我国公众慈善倾向的现状和特点,采取分层随机抽样的方式,运用自编公众慈善倾向问卷对全国10个省市的1618名被试进行社会调查.结果表明:总体上,公众的慈善倾向处于中等水平,其总体得分为110.572±16.129,平均水平3.455,接近单个项目理论中值3.00,且一半以上的人愿意将个人收入和空余时间的2%~10%用于做慈善或参加志愿活动,表现出追求公开化和理性化的趋势.公众慈善倾向在不同
购买决策已成为消费领域研究的重要课题,引起了决策专家和心理学研究者的高度关注。随着我国旅游业发展规模的不断扩大,旅游商品已成为旅游业的一个重要组成部分。在旅游业中,“购”的需求和供给弹性较强,有广阔的发展空间,然而,旅游购物始终是我国旅游产业结构中的薄弱环节。研究在综合分析并借鉴国内外研究成果的基础上,以消费者购买决策理论为研究依据,通过实验探讨旅游商品的消费者购买决策行为,以期为提高消费者决策的
近年来,反生产行为( Counterproductive work behavior,CWB)引起了学术界和企业界的广泛关注,诸如故意缺勤、工作场所侵犯行为、偷窃、故意破坏和职场欺骗等反生产行为多有发生,并带来组织管理成本增加等问题。纵观国内外对于反生产行为的研究,既有对具体某个行为(如性骚扰、故意缺勤等)或某类行为(如职场欺负、服务破坏等)的研究,也有把反生产行为作为一个整体来加以研究。这些研究
目的:意志品质是意志的稳定因素,也是衡量一个人意志发展水平的重要尺度.从发展心理学角度来看,对初中生良好意志品质的培养一方面需要以了解他们的意志品质特点为基础,另一方面在课堂教学、拓展训练、挫折情境体验情境中对初中生意志品质的培养,其效果也需要进行有效评估.编制《初中生意志品质问卷》(AWQ),对其信度、结构效度等进行验证,为初中生意志品质的评定、意志品质的培养提供可靠、有效的测量工具.方法:结合
无领导小组讨论在人事测评中的应用越来越广泛,对其测评误差的研究将为无领导小组讨论技术的开发和应用提供科学参考.但是由于经典测量理论的局限性,仅能对评分者间的信度和测量内容的同质性信度进行分析,且经典测量理论中常用的Kendall和谐系数将比率数据压缩等距数据,很可能造成数据信息的损失.概化理论是逐渐兴起的现代测量理论之一,其"随机平行测验"的假设代替了经典测量理论中的"完全平行测验"假设,更为容易
近年来广泛应用的网上阅卷系统为控制主观评分的误差提供了便捷。然而,在追求评分一致的过程中,评分者的打分可能存在保守趋势,考生的分数分布会出现明显的趋中趋势。本研究对某次国家级大型人事考试的主观评分结果进行分析。结果表明,各题得分离散程度偏小,考生能力并不能被很好区分。评分者所评分数的分布比较集中且处于低分段,体现出评分者打分时相当保守,同时分数全距缩小也降低了主观性试题的效用。各题均值和标准差都随