截止得分

最后更新:

这个词截止得分指的是考试中最低的分数,标准化考试,高风险测试,或其他形式的评估一个学生必须学会通过考试或者被考虑精通。” In some cases, tests may have multiple cut-off scores representing tiered levels of proficiency, such as基本,精通,或先进的。在教育领域,分界点分数也适用于认证和许可考试,这些考试用来确定教育工作者和其他学校工作人员是否具有专业“资格”。

分界点是由个别教师在课程考试中设定的,还是由专家小组使用复杂的心理在大规模标准化测试中,所有的分界点都是基于个人或集体观点的明智判断,不可能证明任何特定的分界点是明确的“正确的”。换句话说,分界点是介于艺术和科学、主观和客观、武断和理性之间的专业判断。有关更详细的讨论,请参见熟练

对于通过测试公司开发的标准化测试,并由各国和国家组织管理到大型学生的群体 - 例如SAT,ACT或国家教育进展(NAEP)评估(NAEP),但仍然仍然是一个过程叫标准设定(标准参照测试)或规范化(norm-referenced测试)。在典型的标准设置过程中,测试开发人员将通过招聘一组专家,例如心理学家(教育测量科学的专家)或来自相关的教师,形成标准制定面板内容区域。然后,该小组将使用一种或多种由心理测量学家和学者开发的基于研究的方法来设定测试标准和确定分界点。这一过程通常需要回顾测试项目(问题、问题、任务),确定每个项目的难度等级,并根据大家的意见,使用统计过程来建立一个分界点或一系列分界点,以对应不同的“熟练程度”(例如,基本,精通,或先进的)。虽然标准制定的复杂性和细微差别超出了本资源的范围,但许多现成的论文、报告和资源致力于解释这一过程的复杂性,包括关于教育成就试验的切割分数的初步通过教育测试服务。

当教师创造和等级测试或其他作业时,截止得分必须更依赖个人专业判断。此外,用于确定截止得分的标准可以广泛变化。For example, historical precedent is often used to establish cut scores for course exams and assignments—e.g., a score of 70 has long been considered a “passing” score in many schools, regardless of the content of the test, how it was designed, or what the score represents in terms of academic achievement. The same passing score of 70 may also be applied to different types of assessments that are evaluated in different ways. For example, a score of 70 on a multiple-choice test may be determined using a simple mathematical formula—70 percent of the questions were answered correctly and 30 percent incorrectly. Yet a grade of 70 on science project or written essay may require a far more nuanced judgment about the content and quality of the work, which might be based on a single teacher’s professional opinion, for example, or on clearly defined criteria described in a标题或者一些老师用来评估的评分指南学生工作以学生到学生或课程的更一致的方式。

辩论

分界点可能会成为与高风险测试有关的持续争论的延伸。,the use of tests to make important decisions about students, educators, schools, or districts. For example, “high stakes” test scores may be used to determine punishments (such as sanctions, penalties, funding reductions, negative publicity for districts and schools), accolades (awards, public celebration, positive publicity), advancement (grade promotion or graduation decisions for students), or compensation (salary increases or bonuses for administrators and teachers). High-stakes testing is one of the most controversial and contentious issues in education today, and because the consequences or benefits tied to cut-off scores on these tests are—at their origin—based on judgments made by a relatively small number of people, cut-off scores can become the object of debate, particularly if they are perceived to be incomplete, flawed, or unfair. For more detailed discussions, see测量误差,测试的偏见,分数膨胀

此外,截止得分 - 以及熟练的乐队,它们代表 - 可以从系统到系统,州至州,测试,学校到学校的测试,以及当然是往返时的课程,或者在变更年份至学习标准和相应的测试。所有的熟练程度的变化都与确定分界点的方法直接相关。因此,例如,有可能通过提高或降低考试的分界点,或通过改变用来决定考试的过程或标准,来改变对学生“熟练程度”的看法。事实上,一些州被指责通过降低分界点或开发基于低标准的考试来操纵对学生能力的看法。这是一项评估学生表现的高二考试内容知识以及他们应该在八年级就学到的技能。由于这些原因,基于分界点分数的熟练度确定可能成为困惑、争论、争议甚至欺骗的来源。

心理测量学家、研究人员和其他专家可能也会就确定标准化考试分界点的具体标准设置过程进行争论,但这些争论很少超出学术界的范围。