之后,我经历了一个月的地狱式锻炼和节食,BMI指数成功降到了26,我的身材评价也从“结实偏胖型”变成了——“偏胖型”。
万万没想到,辛苦减肥,最后减成了一个纯粹的胖子。
这个BMI指数的发明人, 就是被称为“现代统计学之父”的朗伯·阿道夫·雅克·凯特勒(Lambert Adolphe Jacques Quetelet)。
我们今天的故事,就从他开始……
“平均人”概念
除了BMI指数之外,他还有一项重要的开创性理论,就是“平均人”概念。
19世纪40年代,凯特勒测量了5738名苏格兰士兵的胸围,然后把这些数字加在一起,再除以士兵的人数,就得到了苏格兰士兵的“平均胸围”——39.75英寸。
凯特勒宣称,这个尺寸,意味着最接近完美战士的胸围。只要与这个平均尺寸不同,就意味着某种缺陷。
接着,凯特勒把这种推论方式进行了极大的延伸,他认为,“平均人”也是整个人类最完美的标准,这个“平均”不止包括身体尺寸的平均,也包括思想和意志的平均。
他说:“在我们对多数人进行观察的时候,往往看到的是被平均化的意志……只有把人的个性去掉之后,我们才能把所有存在于人们中间的偶然性都排除。”
在凯特勒的眼里,“平均人”代表着“完美”,他认为历史上所有的伟人,都是他们身处的时代中最接近“平均人”的人。
一个社会上所有人与“平均人”的差异越小,这个社会的矛盾也就越缓和。而文化、教育,就应当以减少每个人与“平均人”的偏差为目的,从而缓和社会矛盾、减少犯罪的发生。
“平均人”的思想在历史上的影响极大,弗洛伦斯·南丁格尔将他的思想运用在医学护理上,并相信“平均人”符合“上帝的意志”。
就连马克思在《资本论》中,也运用了凯特勒的“平均人”思想,发展出了共产主义经济学理论。
平均人理论,在凯特勒那个时代,影响了很多人,其中一位,就是“优生学”的创立者——弗朗西斯·高尔顿(Francis Galton)。
高尔顿继承了凯特勒“群体的标准代表了群体的类型”的观点,但他们之间有一个重大的分歧,就是高尔顿并不认为所有对“平均人”标准的偏离都是不好的,相反,他认为那些高出平均人的能力,是值得赞美的。
也就是说,在高尔顿眼里, 平均人不代表完美,只代表了中庸和普通。
以平均人理念为基础,高尔顿把人分成了14个等级,从最低等的“低能者”,到中间的“平凡者”,一直到最高级的“杰出者”。他认为,等级越高,越接近“完美”。
时间转到一百年多前的二十世纪初,因为一个重要人物的出现,高尔顿的思想影响到了教育领域。这个人,就是“教育心理学之父”爱德华·李·桑代克(Edward Lee Thorndik)。
“质量比平等更重要”和标准化考试
桑代克的教育理念,直接继承了高尔顿的思想,他认为学校应该把人分成不同的等级,而 分级的标准就是看他偏离“平均值”的程度。
桑代克的名言是:“质量比平等更重要”。
他主张 通过某种手段把学生分出等级,然后把教育资源倾斜于那些“高等级”的人。而且,桑代克认为,这种等级是“天生的”,有的人天生就是高等人,脑子聪明,学习快;有的人天生就是低等人,脑子笨,学习慢。
教育的使命之一,就是把高等人和低等人区分出来。基于这种理念,桑代克发明了各个学科的标准化考试,通过考试把学生划分成不同的级别,这种方式一直影响到了今天。
这也就是为什么,我们今天的学校教育,无论是课程设置还是学习进度设计,都是以能力处于“平均值”的学生为假象对象,但我们的考试选拔却都是“掐尖”型的。
从凯特勒的“平均人”到桑代克的“标准化考试”,这个发展历程告诉我们,在标准化考试的评价体系中,你作为一个“人”的个性、想法和感情都不重要,这个系统看重的,只是你相对于“平均人”而言是什么状态。
标准化考试制度,并不是为了帮学生更好地学习知识,也不是为了帮助他们成为更好的自己 —— 标准化考试的目的,只是把人分出等级。
所以, 如果我们的教育也完全屈服于标准化考试,把考试成绩视为唯一的衡量标准,那就是在宣告,教育的目的,也只是把人分级。
自桑代克以降的这种教育方式和标准化考试制度,其实背后隐藏着几个逻辑基础。
首先,这种考试选拔制度,默认了一个人各方面的优秀都是“连续的、一致的”——如果你的学习成绩好,在其他方面也应该是优秀的,身体、心理都应该更健康,更有可能是一个有勇气的人、诚信的人……而如果你学习成绩不好,很可能品德修养也不咋地。
就像高尔顿说的:“好的品质都应该是互相关联的。”
这就是为什么,当我们听到一个学习成绩好的学生做了坏事,一个清华北大的学生犯了罪,会觉得很吃惊。
另一个深层逻辑是,这种分级方式其实有一个前提,那就是所有人都是“被造”的,而且是按照某个标准的样子造出来的——每一个人都是依照某种人类标准模板而做出的带有或多或少瑕疵的复制品。
这个世界上存在着一个标准模版,越接近那个标准,就代表你“越高级”。
标准化考试就是在不断定义和传播关于聪明、关于成功、关于完美的标准,这其实是一种压迫,因为这种标准的不断强化,实际上是在宣告每一个受众在某种向度上是残次品。
所有人,在与这个强势标准的对比中,产生惶恐和焦虑。于是,我们看到,学生和家长,都在以行为举止和选择方式上的趋同为手段,向“标准化考试”这一强势文化表达臣服。
及格分
想要普及标准化考试,就必然需要一个可量化的验收标准,于是计分测量就顺理成章被应用到了教育这个原本难以进行量化的领域。其中应用最广泛的,就是五分制和百分制。
在五分制里,如果五分为满分的话,则三分是及格分,在百分制里,如果一百分是满分的话,则六十分被视为及格。
除了五分制和百分制外,还有各种各样的打分制度,比如法国是二十分制,十分是及格分。德国是六分制,分数越小成绩越好,四分为及格分。(所以“爱因斯坦数学考一分最终成为伟大科学家”,并不是什么学渣逆袭的典范)
不管是什么样的计分制度,基本上及格分数都设在略超过平均数的位置上。
有一种说法是,一个人只有掌握了一半以上的知识,才能证明他的学业是合格的(尽管这种说法其实需要一个前提,就是考试里的所有问题都是考察记忆型的)。
还有的观点是说,这就像评价一位医生是不是及格一样,十个人里至少要治愈六个人,才能证明你是一个及格的医生。因为即便医生不治疗,一个人痊愈的可能性也是50%,所以如果十个人里只治好了五个人,很难说是医生治好的还是病人自己痊愈的……
从数学角度来说,如果假设一个百分制的试卷里有一百个采分点,即便每个采分点都是判断对错型的问题,完全靠瞎猜还能得到六十分的概率也是非常低的,所以把六十分设置为及格分,可以在很大程度上避免学生靠掷骰子也能蒙混过关的情况。
但这是一个极其简化的模型,何况现在的考试除了记忆型之外,更多的是考验一个学生能否灵活运用课堂上学到的知识。
而且这里面还存在一个悖论——我们只认为答对试卷上的那个特定问题,才算学生“具备灵活运用的能力”,但实际上,我们可能忽视了 “灵活运用”这个标准本身也应该是“灵活”的……
“60分”的迷思
标准化考试的理念基础,离不开把人“标准化”的思想,离不开“平均人”的概念。
有一个有趣的例子,20世纪40年代末期,喷气式飞机刚刚被研发出来,这种飞机在速度上远超之前的任何一种飞机,相应的,驾驶难度也就更高,结果在飞机质量没有问题,驾驶员操作完全正确的情况下,依然出现了极高的战损率。
美国军方经过调研得出结论,是飞机驾驶舱设计有问题。当时的驾驶舱,还是按照1926年的美国空军驾驶员平均身高设计的。几十年过去了,也许是平均身高发生了变化?
于是美国空军批准了有史以来规模最大的一项飞行员身体研究工作,研究人员测量了四千多名飞行员的十个身体数据,计算出了一个最新的空军驾驶员的“平均人”数据。
研究工作结束后,一位工作人员想要统计一下,究竟有多少驾驶员真正符合那个平均尺寸,于是他整理了那四千多名驾驶员的数据,和那个平均数据进行对比,甚至他很宽松地把差距在30%以内的都算作符合标准。
详细对比之后的结果是,在如此宽松的条件下,符合标准尺寸的人数是:0
根据所有人的数据测算出的那个平均数,却不适合任何一个人。
美国军方反应也是很快,取消了按照标准尺寸设计驾驶舱的方案,改为让驾驶舱座椅可调节——不再让人适应系统,而是让系统来适应人。这项技术最后应用在了汽车领域——今天我们的家用汽车的座椅,都是可调节的。
即便我们用科学的方式做出一个“标准人”的模型,他也很可能不符合任何一个人,人和人之间的差距,要比我想象中还要巨大得多。应该让系统来适应人,而不是让人去适应系统。
针对任何一个人群设计出的“标准模型”,可能只具备统计学上的意义,它在整体上可能是正确的,但在评价任何一个独立的个体时,它都是错的。
就像工业统计学家乔治·博克斯(George Box)说的:“所有的模型都是错误的,只是有一些模型对我们有所帮助”。
对同一个物体进行多次测量得出不同的结果,再把这个结果进行平均计算,得到的数值最接近真实数据。但这不意味着,我们把不同的人进行平均,最后就能够得出一个关于“人”的标准。
如果我们把每一个人都当作独立的个体来对待,对不同的人进行测量后得出不同的结论,并不代表每个人都是某种向度的残次品,也许只能说明,“人”这个物种,是如此的丰富多样。
本文转载自 公众号 埃尔特共学社
图文版权 归原作者所有返回搜狐,查看更多