Norm-Referenced测试

最后更新:

Norm-referenced是指标准化考试目的是比较和排名考生之间的关系。标准参照测试报告考生的成绩是否优于假设的普通学生,而普通学生的成绩是通过与统计选定的一组考试考生的成绩进行比较来确定的,这些考生通常具有相同的年龄或年级水平,但已经参加了考试。

计算标准参照得分被称为“规范过程”,而对照组被称为“规范组”。标准化组通常只包括一小部分以前的考生,而不是全部,甚至是大部分以前的考生。测试开发人员使用各种统计方法来选择标准化组,解释原始分数,并确定性能水平。

通常报告标准的分数作为百分比或百分位数。例如,在第七百分位数中得分的学生也表现出来或比百分之超过同龄百分之一年的百分之七十年,而且三十个学生表现得更好(如通过规范组分数确定)。

标准参照测试通常采用多项选择的形式,不过有些也包括开放式的简答题。他们通常是基于某种形式的国家标准,而不是当地确定的标准或课程.智商测试是最著名的参照标准的测试之一,发展筛选测试也是如此,这些测试被用来识别幼儿的学习障碍或确定是否有资格接受特殊教育服务。一些主要的标准参照测试包括加利福尼亚成就测试、爱荷华基本技能测试、斯坦福成就测试和TerraNova。

以下是一些有代表性的例子,说明如何使用标准参照测验和分数:

  • 确定小孩是否准备好上学前班或幼儿园。这些测试可以用来测量口语能力、视觉运动技能以及认知和社会发展。
  • 评估基本的阅读、写作和数学技能。考试结果可用于各种各样的目的,如衡量学业进展,制定课程作业,确定升学准备,或确定是否需要额外的学术支持。
  • 确定特定的学习障碍,如自闭症、诵读困难或非语言学习障碍,或确定特殊教育服务的资格。
  • 为了制定计划资格或大学入学决策(在这些情况下,通常与学生的其他信息一起评估规范参考分数)。SAT或ACT考试的分数是一个常见的例子。

标准参照测验与标准参照测验

Norm-referencedtests are specifically designed to rank test takers on a “bell curve,” or a distribution of scores that resembles, when graphed, the outline of a bell—i.e., a small percentage of students performing well, most performing average, and a small percentage performing poorly. To produce a bell curve each time, test questions are carefully designed to accentuate performance differences among test takers, not to determine if students have achieved specified学习标准,学习了一定的材料,或获得了特定的技能和知识。根据一组固定的标准或标准衡量性能的测试被称为标准参照测试

标准参照测试的结果通常是基于学生提供的正确答案的数量,分数可以用正确答案总数的百分比来表示。然而,在参照标准的考试中,分数会反映出有多少更多的或者更少的与其他学生相比,正确的答案假设,如果所有参加标准参照测试的学生表现都很差,那么最低差的结果将把学生排在最高的百分位上。同样,如果所有学生都表现得非常好,表现最差的学生将排在最低的百分位。

应该指出的是,常规参考的测试无法衡量整个学生的学习成就或进度,而且只有一个组内的个人的相对表现。因此,使用标准引用的测试来测量全组性能。

改革

标准参照测试历来被用来区分学生,通常是出于课程安排、项目资格或学校录取的目的。然而,因为标准参照测试的设计是为了给学生的表现在一个相对的尺度上——即。与其他学生的表现相比,许多学校和州已经放弃了以标准为参照的测试,而倾向于以标准为参照的测试,这种测试根据一套共同的固定标准或标准来衡量学生的表现。

应该注意的是,通常引用的测试通常是这种形式的标准化考试被广泛用于遵守州或联邦政策,如《不让一个孩子掉队法案》,旨在衡量学校的表现,关闭"的差距“或持有学校对改善学生学习结果的责任。在大多数情况下,标准引用的测试用于这些目的,因为目标是确定学校是否成功教学学生预期学习的内容。

类似地,评估是用来衡量学生成绩的常见的核心国家标准也是参照标准的考试。然而,一些测试开发人员推广他们的标准参照考试,例如TerraNova共同核心考试,作为一种教师“基准”学习进度的方法,并确定学生是否在基于共同核心的评估中表现良好。

辩论

尽管规范性参照测试并不是目前关于"高风险测试尽管如此,他们仍然是很多争论的对象。一些人认为标准参照测试是客观、有效和公平的学生表现衡量标准,而另一些人则认为依赖相对表现结果是不准确的、没有帮助的和不公平的,尤其是在为学生做重要的教育决定时。虽然部分的争论主要集中在是否这在伦理上是合适的,甚至教育有用,来评估个体学生的学习与其他学生(而不是评估个人表现与固定和已知的标准),争论的焦点也集中在是否有一种普遍的过度依赖标准化测试分数在美国,无论是单一的测试,无论其设计如何,都应该用于排除其他措施 - 评估学校或学生表现。

应当指出的是,标准化测试的感知成绩有可能受到操纵,无论该测试是参照标准还是参照标准。例如,如果大量学生在考试中表现不佳,那么表现标准——即。在美国,衡量“及格”或“熟练”的标准可能会降低,以“提高”学生的认知表现,即使学生并没有比以往的应试者学习得更多或表现得更好。例如,如果在11年级执行的标准化测试使用的能力标准被认为是相当于8年级的学习预期,它将显示学生表现很好,而事实上,测试并没有衡量在一个适当的年龄或年级水平的学习成就。因此,调查用来确定任何给定测试的“熟练程度”的标准是很重要的,特别是当一个测试被认为是“高风险的”,因为当结果与制裁、资金减少、公共尴尬、或者其他负面后果。

以下是标准参照测试的支持者提出的典型论点:

  • 标准参照测试的开发成本相对较低,管理简单,易于评分。只要这些结果与其他成绩衡量标准一起使用,它们就能提供有关学生学习的有价值的信息。
  • 规范参考测试的质量通常很高,因为它们是通过测试专家开发的,在与学生一起使用之前试验和修订,并且它们是可靠的,并稳定他们旨在衡量的内容。
  • 标准参考测试可以帮助区分学生,并确定那些可能有特定的教育需求或需要专门援助或学习环境的赤字的人。
  • 测试是一种客观评估方法,可以在做出教育决策时减少偏见或偏袒。例如,如果有限的地方有限的地方,例如,做出决定的一种透明方式是给每个学生同样的考验,并允许最高评分的学生获得进入。

以下是规范参照测试的批评者提出的典型论点:

  • 虽然测试专家和测试开发商警告说,不应根据单一测试评分的主要教育决定,在制定批判性教育决策时,规范参考分数通常在学校滥用,例如促进或保留,这可能是可能的对一些学生和学生团体的有害后果。
  • 标准参照测试鼓励教师从钟形曲线的角度看待学生,这可能导致他们降低对某些学生群体的学术期望,特别是有特殊需要的学生,英语学习者,或少数群体。而当学业预期年复一年地持续下降时,这些群体中的学生可能永远也无法赶上他们的同龄人,从而产生了一种自我实现的预言。相关讨论请参见很高的期望
  • 选择题测试——主要的标准参照形式——比更复杂的思维形式更适合于衡量记忆中的事实。因此,标准参照测试在学校提倡死记硬背,而不是更复杂的认知技能,如写作、批判性阅读、分析思维、解决问题或创造力。
  • 对规范参照测试结果的过度依赖可能会导致对少数族裔和低收入学生群体的无意歧视,这两个群体往往面临更多来自高收入家庭的非少数族裔学生的教育障碍。例如,许多教育工作者认为,过度使用标准参照测试导致了少数族裔学生在特殊教育项目中的显著比例过高。另一方面,使用标准参照分数来决定天才项目或其他“丰富的”学习机会,导致少数民族和低收入学生在这些项目中的代表性不足。同样,来自高收入家庭的学生可能在大学录取过程中有不公平的优势,因为他们可以负担昂贵的备考服务。
  • 过分依赖标准参照的测试分数低估了重要的成就、技能和能力,而倾向于测试所衡量的更狭窄的技能。