经济观察

储朝晖:对中国教育“均值”与“方差”的观察可信吗?
发布时间:2015-06-09 11:29:34

 

 作者简介:储朝晖,1964年生,博士,中国教育科学研究院研究员,中国陶行知研究会副秘书长,中央教育科学研究所研究员,中国地方教育史志研究会学校史志分会理事长,中国地方教育史志研究会副会长,《教育史研究》副主编。主要研究领域:教育管理、教育史、教育技术、教育心理、农村教育、职业教育、大学精神。2010年被《时代周报》组织的两岸四地媒体人评选为“2010年影响中国时代进程100人”中的十大教育工作者,2012被网易评选为年度教育意见领袖。2014年入选搜狐网“2014中国教育推动者”。
 
3月17日,本版头条刊发清华大学经济管理学院院长钱颖一的文章《中国教育问题的“四大特点”》,从“才”与“人”两个维度指出中国教育问题呈现出的显著特点,即在“才”的维度上“均值高,方差小”,在“人”的维度上“均值低,方差大”,并围绕“人”重于“才”,教育既要“教”更要“育”的理念,以清华大学经管学院的“四大行动”为例,提出解决问题的具体办法。文章刊出后,迅速引起了教育界乃至全社会的广泛关注和热议,围绕“均值”与“方差”的讨论不断发酵。中国教育科学研究院研究员储朝晖向本报独家撰文,就“均值”与“方差”的实证基础提出质疑并与钱先生商榷,本版今日特刊发此文,以期和读者一道与专家、学者进一步探索教育改革的现实路径。
一年前,在一次讨论会上遇到钱颖一先生,当时他说中国教育严重而普遍的问题是短期功利主义,对此我高度认同。由于我俩都曾学过数理专业,在思考问题的方式上还有不少相同之处。
近来,各种渠道传来钱颖一先生对中国教育的“均值”与“方差”的观察,初看觉得这种观察有新意,深入思考便觉得这一说法很难立得住,就如同本人也曾经试图列出函数关系式,建立教育场论,用能级跃迁解释人和人群的成长发展,后来长期琢磨,觉得要做到像钱先生那样形象描述一下还是可以的,但由于难以建立普适的规范,又缺少实证的基础,再三考虑觉得还是不能生搬硬套。
依钱先生的思路,您所说的“均值”和“方差”的具体变量是什么
如果进行纯数据计算,当然可以就一组无具体变量的数据做均值和方差的计算;当你用它来测评一个具体对象时,用来评价教育的状况时,就应该有具体的可通过实测获得的变量数据。比如一组学生依据某个量表测得的记忆数值,可以做均值和方差计算以了解其集中与偏离趋势,再如平均速度、平均身高、平均产量、平均成绩等等,都是有具体可度量变量才言之有物。而钱先生多次讲到中国教育人才的“均值高、方差小”和中国人素养“低均值、高方差”时均未提到是对哪个变量统计得出的结果,或用什么测量工具(量表)测出的数据。比如说中国教育在知识能力培养上“均值”高,这个均值是什么变量的均值?人才水平“方差”小,缺少拔尖者,又是什么变量的方差?在没有变量、没有变量测量数值的时候就得出它的均值高、方差小能站得住脚吗?所能见到的仅是举例,均值和方差的值恰恰不能建立在举例基础之上,对人才和素养的评价也不能在没有经过数值测评的基础上就得出均值和方差的结论。
钱先生所说的方差和均值是否有实证调查统计依据?多大范围,多少样本?直观观察怎样得出均值和方差
钱先生一面强调“由于我没有受过系统学的教育方法,所以不熟悉系统学的教育理论框架,不过我是教育实践者,我想从直观的观察开始”,您所讲的观察是您几个阶段的求学和执教经历,它们留在您脑中的主要是表象,而您说出的结论却是需要测量、统计计算才能得出的“均值”和“方差”,一般人很难按数理统计的规范理解中间的依据何在?既然用了数理统计的“均值”和“方差”,那么样本从何而来?在多大范围内选取的样本?如何抽样,选取了多少样本?就以所举国际学生测评项目(PISA)中上海学生在3个科目(阅读、数学、自然科学)都名列前茅的表现能说明全国的情况吗?同样,中国友谊奖获得者经济学者罗斯高(Scott Rozelle)在中国工厂里对年轻工人用小学五年级水平的试卷进行考试表明:“有60%的人数学不及格,有70%的人语文不及格,英文就更不用说了”,而所测这些工人大都是有初中毕业文凭的。您将中学生学业测评成绩当作社会人才状况的判断也不够准确。数理统计当然可以进行推断或预测,但前提是要有测量数据。
从本人长期实地调查的情况看,由于农村学生基数大,难以开足开齐课程的现象还比较普遍,学的内容和方法都过于刻板,若选择初中毕业时对中国学生掌握知识的情况测量,其均值未必就高到哪里,钱先生用自己经验观察到的例证和上海这一不到全国学生总数千分之五的局部区域的情况就对全国的教育状况下判断,也是冒着很大风险的。
“人”和“才”能否找到可信而又通用的一个标准变量进行数值测评
钱先生做出这样的判断背后还有一个假定,就是全国范围内的“人”和“才”都是可以找到一个变量加以测量评估的,至少是“人”可用一个变量测量评估,“才”可用另一个变量测量评估。如果不存在这样的变量,也就得不到它们的均值和方差。
由于中国高考长期用加总分的方式评价一个学生,给不少人造成一个极为严重的误解,认为所有人都可以用某一个分值准确地与他对应,或者说存在一个普适的标准可以准确无误测出各种各类人的才智高低,并得出一眼就能看清的数值,其实这是特大的误解。加总分严格讲就是逻辑混乱的,一个人在数学上的得分与在语文、英语等其他科目上的得分是不等值的,把它们简单相加实质上就是把2只鸡加4条鱼加5头牛,单位不一样,却得出个总数;同样,一个人在一次考试中得了20分与另一个人在同一次考试中得了90分,他俩所得分数的每一分的分值也是不等的,用这种方式加总分的分值计算均值和方差在数理逻辑上也是混乱的。
再从人的天性而言,在人类进化中,不同人的智能类型是不一样的,想比较真实地测出人的智能或其他特性,就必须依据人多元智能的天性使用多元的测量标准测量,不同标准测出的数值是不可比的,也就不能相加,不能求平均值,也就没有对所有人适用的方差。如要用一种可测变量测量所有人,也可算出均值和方差,比如用测艺术能力的变量测所有人,对那些没有艺术特长却有其他特长的人而言,这样所测得的数值根本反映不了这个人智能状况的全貌,这样所测得数值既不能说成是“人”的均值和方差,也不能说是“才”的均值和方差。
一百多年前比纳—西蒙设计智力量表时就希望能通过一个数值测出所有人的智能高低,但至少在现有的科学发展水平上还找不到一个可以同时测出各类不同人才的“人”的变量和“才”的变量,或者依据现有对人的认识,可以说从逻辑上分析不可能存在这样一个可测变量。
钱先生一边赞赏中国大规模的基础知识和技能的传授很有成效,使得中国学生在这方面的平均水平比较高;另一面又批评中国学生缺乏好奇心、想象力、批判性思维能力。您所赞许的部分正是导致您所批评的现象产生的原因,所赞所贬是同一硬币的两面。
正如钱先生自己所言,“我们的教育扼杀潜在的杰出人才”,其过程就是用统一的标准要求所有学生,用一致的内容教所有学生,用灌输的方式教所有学生,花双倍的时间和精力学固定的知识点和标准答案,从而使得学生没有自主性形成被动人格,大量做题错过了在十四五岁立志的关键期,大多数学生考得高分而失去了学习的兴趣,钱先生却“觉得这是中国教育的一个重要优势,是其他的发展中国家、甚至是一些发达国家都望尘莫及的”。
而有的国家更加尊重孩子的天性,不做过于同一刻板的要求。比如对数学而言,不感兴趣的可以少学,腾出时间和精力去学自己感兴趣的内容从而在那方面超出别人;有天赋和有兴趣的高中生所学数学则远远超过不少大学生的数学水平。每个人依据自己的天赋发展,虽则每个人的发展是不平衡的,但最终总体上成才的几率较高。不顾人的天赋,不遵从人成长的规律要求所有孩子同步前行,必然有一些学生觉得太慢、天赋未能充分发挥,另一些学生被拖着走又觉得太累,还有一些学生感到没有时间和机会发展自己的天赋所长,大家都不能发展好,整体的成才率自然较低。
这也正是钱先生所说的好奇心和想象力部分来自天生,“正是我们的教育把人先天的好奇心和想象力扼杀了,加上学生的批判性思维能力得不到培养,学生怎么可能有创造力?”
明了上述内在机理,难道还需要对这种通过违背人才成长发展规律的教育方式获得的暂时性学业“高分”点赞吗?就以中国学生的“平均水平较高”而言,那是知识测试得分高,大量事实表明并非动手能力强、实践能力强,也不是独立思考能力强,更不是创新能力强,您也“不否认中国缺乏创造力、领导力、影响力”,由此得出中国学生在“才”的方面均值高,显然也是缺乏充足依据的。
  
文章来源:中国改革论坛网,转载自《光明日报》
详见:http://www.chinareform.org.cn/society/Edu/Practice/201503/t20150324_221295.htm