高考阅卷经验分享

羊肾2022-09-01  9

高 考 阅 卷 的 秘 密

1000万人在用注册神器,注册购买时间会减少200。早做打算,得分后赢!

大部分高中生都会把“最后一场考试结束,铃声响起”的那一刻定义为自己高考的结束。学生交卷,就像孕妇生孩子。所有的痛苦都能消失,剩下的只能听天由命了。

然而,其实在另一个你看不到的房间里,真正决定你命运的故事才刚刚开始。

我是高考阅卷组的老师。

高考群体是一个很少占用舆论资源的组织。一般情况下,你很少听到关于这个组织的公开讨论。

为什么?

一方面,这是因为和世界上所有的组织一样,高考评卷组的直接表现就是没有人感受到它的存在——每个学生在交试卷的时候,总能根据自己在考场上的表现估算出一个大概的分数,而当你拿到成绩单的时候,总能发现自己的实际分数和自己的预期大致相符,这说明我们对你的评分是可以达成共识的;

另一方面,由于高考本质上是中国一种重大的人才选拔机制,高考的阅卷在某种程度上成为了一项政治任务——是的,如果你的阅卷很容易影响一个人的命运,那么你的工作就应该非常细致,极其严格。

最后,高考评卷组的每一位成员在进入评卷现场时都必须签署保密协议,每道题的评分规则都会在一定时间内(目前一般为五年)严格保密。所以大部分老师都会本着“少说话少犯错,不说话不犯错”的原则,选择在公共场合沉默。

这就有意无意的造成了一个舆论真相空:所有的老师都在强调“多一分,胜过千人千面”,但是很少有同学知道那些评分的人是怎么决定你最后的分数的。

当没有人在公开场合正式解释这些过程时,就出现了没有明确信息来源的谣言。

你一定或多或少听过以下关于高考阅卷的传言:

1.老师1秒改一张试卷,只看最后的答案。如果他犯了一个错误,他将得到0分;

2.如果你写得更好,老师会给你更多的分数;

3.评卷任务很重,老师为了赶时间不会那么严格;

当然,最受欢迎的是下面这个:

4.如果实在不会写,就编点东西填答题卡,老师会给你一些硬点的!

-这些可以吗?

他们都错了!

在本章接下来的部分,我会向你介绍高考阅卷的基本流程和阅卷的基本原则,帮助你更多地了解阅卷人的思想。

你的分数是由阅卷人决定的,但如果你知道阅卷机制,那么你的分数是由你自己决定的。

1.标准统一:阅卷老师岗前培训。

“公平”是评判NMET的首要标准。

然而,公平是一个抽象的概念。高考阅卷过程中应该如何体现公平?-很简单。我们只需要保证判断点在两个维度上的统一:

1.第一个要求是,要抹去阅卷组成员的个人偏好:对于同一张试卷,不同阅卷老师给出的分数要一致;

2.第二个要求是,考生之间的评分原则要保持统一:对于同一个阅卷老师,如果批下来的两张试卷用的是同一个解法,那么两张试卷要得到相同的分数。

——围绕这两个基本要求,高考评卷组进行了一系列制度设计,以保证评卷的公平性。

中国每个省份都有几十万考生参加高考。这么多卷子7-10天就要批改,很多老师经常需要在阅卷组同时工作。高考阅卷的制度设计,大多是为了保证不同老师对评分规则有统一的认识。具体方法分为以下步骤:

首先,和所有工作一样,阅卷团队需要岗前培训。

因为整个高考阅卷过程会持续7~10天(一般8天,很少超过9天)。

基本情况是:正常情况下,7、8号高考结束,之后会对考生的试卷进行扫描归档。阅卷工作一般从11号或12号开始。

按照惯例,考生在25日凌晨就能查询到自己的分数,所以一般来说,23日就完成了分数的统计核对,严格来说,24日的工作就结束了。

不过,尽管时间很紧,我们肯定会有半天时间进行阅卷培训,具体内容是帮助每一位阅卷老师准确理解高考的评分规则。

在此期间我们会签订保密协议,强调一些纪律问题,包括评卷期间不能私自接受媒体采访,评卷期间禁止公开披露评分规则,评卷工作结束后五年内禁止披露评分规则。

然后,我们每个老师都会收到我们即将复习的问题的答案——这份,叫做“评分规则”,和省教科所后来公布的参考答案一样。唯一不同的是,我们得到答案后,每一步都标有相应的分数,这是我们工作的核心。

在纸质阅卷的时代,这个答案需要每个老师签字,用完后上交;但是现在,因为我们都改成了电子阅卷,这个答案将不再有纸质版,而是自动保存在每个阅卷老师登录的系统中。

阅卷组组长会对这个规则做非常详细的讲解。

有多好?

除了常见的“每一步的哪个位置应该给什么分”的问题,每个题评卷组还会“猜测”学生会在哪里出错——比如有些题的某个条件就是命题人给学生挖的坑,一个题有不同的坑。评卷组老师会评估考生掉进不同坑的后果。

老师在教你“猜测提问者的意图”。其实考官们也在“猜测答题者的意图”。

评卷组认为考生会犯的典型错误会被列出来,评卷组长会逐一给我们讲解每一个错误发生时如何扣分。

当然,在组长做完评分规则后,阅卷组的所有成员在开始工作前,都会有一个所谓的“适应性练习”:我们会从今年实际上交的试卷中随机抽取几千套试卷作为“样卷”,依次交给每个老师进行评分,以此来检验大家对规则的理解程度——这几千套试卷会在阅卷组所有老师的机器之间不断轮换,目的是帮助。

在这个训练过程中,每个老师大概会复习200到300套样卷,因为样卷会被系统随机反复分发——也就是说,你复习了200到300套试卷,但其中甚至有150套是重复的。有时,一张试卷可能会以破碎的重复出现在你面前,目的是系统会有与你两次看到同一张试卷时相同的评分结果;还会比较你的成绩和其他老师的差距是否太大。

如果你的评分与同行有较大偏差,系统会把你挑出来,阅卷组长会单独找你谈话,逐一给你进一步的解释,看看你对评分规则是否了解不够。

适应性训练结束后,我们将进行第二次训练。就是评卷小组的所有成员聚在一起,就我们在评卷样卷的过程中是否遇到了一些非常特殊的情况交换意见,这在以前是闻所未闻的。

这个链接是我的最爱。阅卷过程很枯燥,但这个环节总是充满惊喜。

老师会给你讲一些你没听过,根本想不到的东西。

比如我在2018年阅卷过程中就遇到过这样一个学生。

那年全国I卷理科数学17题是一个三角形的问题,最后一题是求一边的长度:

又一个熊海子,估计真的数不过来了。他居然在答题卡上画了一个特殊的标准图(真的是特殊的标准),然后写上“根据精确的绘制和测量,可以得出:……”——这个问题最后的结果是5。因为他的画图太精确了,所以他测出了一个正确的结果!

你看,命题组的老师能提前想到这样的案例吗?

真不敢相信!

但是在阅卷的过程中,会出现严重的字。

那么这些非常特殊的案例应该如何判断呢?

任何老师都不可能独自做决定。我们会把这些特例反馈给阅卷组长,然后所有老师一起讨论。最后,讨论决议将包含在评分规则中。

即使你的案例是特例,这个专门化的案例也会在我们的评分过程中获得统一的认知。如果下次有其他同学想出和你一样的特殊答案,我们可以保证你们两个分数一样。

它是我们在岗前培训中所追求的“公平”原则的体现。

2.三重保护:维护评卷过程的公平性。

除了职前培养阶段的制度设计,真实阅卷过程中也有很多环节可以随时监控老师对评分规则的掌控。

在中考阅卷系统中,每位监考老师登录后,屏幕上会有60秒的停顿,屏幕上只有一行红色的字:

“现在已经进入正式评卷阶段,你的评卷将直接影响考生的最终成绩。请严格执行评分规则!」

除了盯着它看60秒,你什么也做不了。

每一个阅卷老师都知道,自己面对的不是流水线上的工业产品,每一张卷子的背后都是一个十年苦读的具体学生。

每一个参与高考阅卷的老师,自己也经历过高考,很多都是毕业班多年的老师。了解了这一点,你就明白了,网上“随便改个年级”的说法,在教师的主观意愿中是很难成立的。

而在客观条件上,教师在评分时会非常谨慎,比如阅卷系统的制度设计:

首先,系统设置是我们的电子阅卷系统会“随机重复”一些你之前批改过的卷子给阅卷老师。

但一般来说,如果一个老师每小时检查几百张卷子,我们是不可能记住哪张是自己批改的,但系统会时不时悄悄给我们一张之前批改过的卷子。系统的目的是看同一个人是否把同一篇论文看了两遍,你的分数一点都不差。

这个分数不能有错。如果你的两次评分出现错误,系统会马上给你做记录——同一个人改了同样的卷子,两次的分数居然不一样,说明你对评分规则的理解肯定有问题。如果你一直有这个问题,阅卷组长会把你叫出来私聊,看看你怎么了。

第二个系统设置叫做“双重确认”。

这可能是最流行的设计。很多同学都听过这样一句话:你的每一个试卷系统,都会分发给至少两个老师进行评分。我们至少要审阅200万份试卷。虽然这样会直接让我们的整体工作量增加一倍,但这是必须的工作。

对于每道题,系统都会设置一个容错率——这个分值通常是1到2分,往往和这道题的总分有关——比如高考全国数学卷的所有大题都是12分,那么它的容错率一般是2分。

当两个老师复习同一个问题时,系统会比较两个老师分数的差异。如果差值不超过容错率,那么一个学生的最终分数将是两个老师分数的平均值:比如一张试卷,我认为这个考生应该得8分,然后另一个老师认为这张试卷应该得9分,这样就可以了。这个学生的最终成绩是8.5分;

但是,如果两个老师对同一个题目的评分超过了容错率,那么系统会引入第三个阅卷老师进行评分,并比较三个老师之间的差异,取两个老师最小邻居的平均分:比如一张试卷,我认为我只能得5分,另一个同学老师认为其实是8分的试卷,那么系统会引入第三个老师进行评分。如果第三个老师认为是6分的试卷,那么系统会

这个时候,得了8分的老师居然判了成绩无效——这在我们的行话里叫“废纸”。废纸意味着你的成绩和同龄人有特别大的偏差。前面的例子,大部分人以为是5-6级的试卷。你为什么认为它值8英镑?你对评分规则的理解肯定有问题,所以如果一个老师评判的拒绝率太高,你还是会被阅卷组长叫出去单独谈话。

当然有时候你会问:如果三个老师的分数是等差数列呢?举个例子,刚才的例子,如果第三个老师得了11分——5,8,11,也就是说没有谁更接近谁,也就是说三个老师对同一张试卷的认知是非常离散的,怎么办?

首先,你可以想象这样的情况很难在现实情况下出现。总共12分的题怎么会有这种离散的差异化分数?

但如果出现这种情况,这篇论文会提交给阅卷组组长仲裁。

一般来说,这种情况下,阅卷组长会把打分的三位老师叫进来,听听每一位的决策过程,综合考虑后给出一个最合适的分数。

最后,还有一种很特殊的情况,就是在阅卷的过程中,会遇到一些原版本评分规则之外的解决方案。是正确的解法,但是在我们的评分规则之外——这种情况在解析几何和导数的大题中经常遇到。

如遇评分规则中不存在的此类解决方案,我们评卷组的老师无权直接评分——我们会在评卷系统中点击“问题试卷”,将此试卷直接提交给评卷组长。

如果这种特殊的解法只是偶尔发生,比如上午改完几万张卷子后的一两次,那我们就在下午阅卷前开一个分析会,把所有老师都召集起来,讨论这个解法要不要评分,给多少分。

然后,一旦达到这个标准,我们就会形成一个决议,这个决议会被附加到我们的评分规则中,以附录的形式发放到每一个老师手中,也就是说这个所谓的“特解”也被纳入了评分规则中。如果以后遇到类似情况,我们也会按照评分规则进行评分。

当然,还有一种情况,这种特殊的解决方案是非常常见的。一个上午的时间,阅卷组长就收到了十几份关于这个方案的问题试卷——然后阅卷组长就可以直接叫住所有老师,直接开始对这个方案的讨论,相当于在下一次阅卷工作开始之前召开了讨论会议。

大家可以看到,整个阅卷过程非常规范。

3.审查者的限制:规则、程序和评分规则。

任何一个阅卷老师都没有决定别人命运的权力——我们也受到各种约束:你的阅卷需要经过同行的审核,你的错误会被系统记录,你不能单独直接给评分规则中不存在的解答打分。

总之,阅卷老师的权力是非常有限的,高考阅卷是一项非常单调甚至枯燥的工作。

曾经听过一个笑话:一个阅卷老师告诉他的学生,阅卷是一件非常枯燥的工作,富士康流水线工人做的都是重复性的体力劳动。

他的学生问,老师,你在阅卷组做什么?

这个老师说:我负责把答题卡塞进读卡器。

作者:高考数学阅卷组成员,武汉大学基础数学硕士,在知乎获得60多万赞同,出版著作《应试数学》。

本文版权归作者所有,转载本文旨在传递更多信息。如涉及版权,请联系删除。

转载请注明原文地址:https://juke.outofmemory.cn/read/1427532.html
最新回复(0)