测量错误

最后更新:

测量错误一般在教育中指的是(1)考试分数与学生实际知识和能力之间的差异,或(2)在收集和计算基于数据的报告、数字和与学校和学生有关的统计数据时出现的错误。

由于某些程度的测量误差在测试和数据报告中是不可避免的,教育研究人员,统计学家,数据专业人员和测试开发人员通常会公开承认高中毕业率或高校入学率,例如高中毕业率或高校率并不完全可靠(它们may even report the “margin of error” for a given statistic or finding) or that test scores don’t always accurately reflect what students know or can do—i.e., that there is no such thing as a perfectly reliable test of student knowledge and skill acquisition.

测试中的测量误差可能由各种因素产生,例如学生的心理和情绪状态在测试期间或施用测试的条件。例如,学生可能已经异常疲倦,饥饿或情绪痛苦,或者诸如响亮的声音,破坏性同行或技术问题的分心可能会产生不利影响的测试表现。鉴于幼儿往往具有更短的关注跨度,他们可能无法完全理解考试的重要性并认真对待这一目标并认真对待这一认真的重要性,因此尤为容易受到测量误差。此外,相同时间年龄或年级的幼儿可能是社会,认知和情绪发展的阶段非常不同,如果一个幼儿经历了快速发育的生长刺激,测试结果可能会迅速变得过时,因此歪曲。

以下是一些在测试中可能引起测量误差的其他因素和问题的代表性清单:

  • 含糊不清的措辞或不准确的答案。
  • 测试项目,问题和问题可能无法解决材料学生实际教授。
  • 表现水平和分界点,比如那些被认为在某项测试中“及格”或“熟练”的分数,可能是有缺陷的、校准不当的或不准确的。
  • 评分过程可能设计不佳,人类的分机和计算机评分系统都可能犯错误。
  • 测试管理员可以给学生提供错误的指示,帮助学生作弊,或者未能创造平静和有利的测试条件。
  • 测试结果数据的记录和报告可能不准确。

教育数据和统计数据报告中的测量误差是常见的,并且在更大或更短的程度上,预期和不可避免。虽然人为错误可能导致报告不准确,但数据系统和过程是内在的限制 - 即,即,由于系统在规模和范围的增长而产生完美的数据系统或收集数据是不可能的。National or statewide data systems—e.g., systems administered by government agencies to track important educational data such as high school graduation rates—are especially prone to measurement error, given the massive complexities entailed in collecting data from thousands of schools on the performance of hundreds of thousands or millions of students. For this reason, most large-scale education data are openly qualified as estimates.

以下是可能导致教育数据测量误差的其他一些具有代表性的因素和问题:

  • 有缺陷的、不精确的或管理不当的数据收集过程会导致不正确的报告、记录、数字和统计数据。
  • 缺少清晰易懂的数据收集和报告过程的规则、指导方针和标准,或模棱两可的指导方针,导致误解和错误。
  • 小型样本大小 - 例如在农村学校,可能有小学生人口和少数少数民族学生 - 可能扭曲某些时间段,毕业课或学生团体的表现的看法。
  • 不同的数据收集和数据报告过程——比如国家开发的独特的数据收集系统和需求——可能会导致错误的比较或产生错误的系统不兼容。
  • 高校系统 - 例如,瞬态工人的儿童的高速转移 - 这使得能够准确地追踪学生的入学地位更加困难。
  • 在适当的数据收集和 - 负责在学校,地区和国家级收集和报告数据的人中,缺乏适当的培训,经验或技术专业知识。
  • 故意歪曲学生表现和注册,例如可能陪伴的人高赌注测试

改革

虽然某种程度的测量误差是不可避免的,但许多教育工作者、学校、地区、政府机构和测试开发人员正在采取措施来减少测试和数据报告中的测量误差。

在测试中,对于低风险的测试,测量误差通常被认为是一个相对较小的问题。在美国,考试成绩没有被用来对学生、老师或学校做出重要决定。然而,随着与测试性能相关的风险增加,测量误差成为一个更严重的问题,因为测试结果可能触发各种各样的结果。测量误差是许多测试开发人员和测试专家不建议使用单一测试结果来做出重要教育决策的原因之一。例如,教育和心理测试标准- 由美国教育研究协会,美国心理协会和全国教育委员会联合开发的拟议指南 - 建议“在小学或中学教育,决策或表征中,这将对测试产生重大影响接受者不应根据单一测试得分自动进行。“

以下是一些教育家和测试开发人员可以用来减少测试中测量误差的典型策略:

  • 测试开发人员可以仔细审查问题测试偏见以及公平,删除或修改可能对不同种族、文化群体或性别的学生的表现产生不利影响的项目。
  • 测试开发人员可以通过试点测试获得关于难度等级、措辞清晰性和偏见的反馈,然后在执行之前修改测试。
  • 为了减少无法被计算机被评分的问题的人为评分的错误,例如开放式响应和论文问题,两个或更多的得分手可以获得每个项目或文章。如果他们不同意,可以将该项目传递给额外的评分器。
  • 学校可以收紧安全实践,以便通过管理和参加考试的人来防止作弊。
  • 政策制定者可以降低或消除测试结果造成的后果,使其最小化分数膨胀减少操纵结果的动机。
  • 学校不能依靠一个可能不准确的措施,通过使用多种方法来评估学生的成就和学习增长,可以获得更全面的信息。

在教育数据的收集和报告中,测量误差也可能成为一个重大问题,特别是当学校资助水平、处罚或对成绩的看法受到公开报告数据(例如退学率或毕业率)的影响时。由于这些和其他原因,提高数据系统、收集过程和报告要求的质量和准确性已经成为学校、政策制定者、政府机构以及各种组织和倡议(如美国国家统计局)日益优先考虑的问题数据质量活动共通教育数据标准,正在努力提高教育数据的质量,一致性和可靠性。

以下是一些教育家和数据专家可以用来减少数据报告中的测量误差的有代表性的策略:

  • “独特的学生标识符”,如国家分配的代码或社会安全号码,可用于促进个人学生的跟踪,并增加数据可靠性,因为它们从等级到年级或学校到学校。
  • 可以制定通用的数据收集和报告标准,以提高数据的可靠性,并允许在各个学校和州之间进行绩效比较。
  • 冗余进程 - 多个系统和人员检查错误 - 可用于提高报告准确性。
  • 可以提供更清晰的准则和更好的培训,可以向编译和计算数据提供。
  • 改进的技术和兼容或互操作系统的使用可以促进数据质量和不同学校、组织和州之间的数据交换。