第3章 推翻平均标准

在早期漫长的职业生涯中,彼得·莫勒纳尔(Peter Molenaar)是一位受人尊敬的平均主义科学家。他的心理发展研究大部分都是基于平均标准,并以此赢得了国际知名度。他对平均主义的价值深信不疑。有时候,莫勒纳尔的同事表示行为科学家在研究个体时太过于依赖平均标准,他还会与之针锋相对。[1]

莫勒纳尔的自信看起来似乎合情合理,毕竟,他已经花了一辈子的时间潜心钻研数学。高中时期,他入选参加了荷兰奥林匹克数学竞赛。他在自己的发展心理学专业博士毕业论文里展示了高超的数学能力,描述了“由延迟的协方差函数的受限频谱分解衍生出了一个动态因素模型,并由此分化出一个奇异分量和一个非奇异分量”。莫勒纳尔后来的心理学文章里常常列满了方程式和证明过程,外行读者可能会疑惑,这些文章里到底有没有心理学新发现呢?[2]

他凭着自己的数学天赋和对平均主义的执着,登上了荷兰的学术之巅。2003年,莫勒纳尔就成为H1教授,这是荷兰教育系统里的最高级别。他还是著名的阿姆斯特丹大学(University of Amsterdam)的心理系主任。但是在荷兰,学术巅峰是有保质期的。荷兰法律规定,所有H1教授都必须在62岁时从自己的职位上退下来,以便为后继者留出位置,而在65岁时,必须完全退休。2003年,莫勒纳尔59岁,他不确定自己是否为退居二线做好了准备,但是至少他很希望在自己的游戏里继续策马奔腾,直至学术生命的日落之时。此时,一个问题意外地摆在了他的面前。

那时,莫勒纳尔只剩下三年的学术生涯了,由于一位同事突然被撤下来,学校安排莫勒纳尔代替他去上秋季学期的一门课程,他还为此感到些许烦恼。这门课程是关于心理测验的理论和方法的研讨班。相信我,这种课听上去就很无趣,学起来也一样无趣。由两位心理测量学家弗雷德里克·罗德和梅尔文·诺维克编写的教科书《心理测验分数的统计理论》(Statistical Theories of Mental Test Scores )在1968年出版,常常被誉为“测验的圣经”,书里的许多测验理论都被重新编写进了现代教材。[3] 直到今天,对于所有希望设计、执行和理解标准化测验的人来说,它依然是必读书目;我在读研究生时也必须读这本书。这是那种你想尽快读完了事的书,因为它的趣味性和纳税申报表相差无几。实际上,这本大部头的书太过枯燥无味,根本就没人注意到在它那催人入睡的篇幅之中还隐藏着推翻平均主义的线索。

作为代课老师,莫勒纳尔为了准备教学内容,翻开了他的那本罗德和诺维克之书。他将这一时刻称为“aha-erlebnis”(顿悟,德语词)。正是从这一刻起,他的生命历程发生了巨大变化——社会科学的基石也由此被动摇。在这本书的序言里,罗德和诺维克根据他们的观察,认为所有心理测验都试图从某些兴趣特点上辨别测验者的“真实分数”。这样做是很有意义的。我们让别人做智力测试、性格测验或大学入学考试,不就是因为我们想知道他们真实的智力排名、真正的性格类型和真正的天资差异吗?

接着,罗德和诺维克观察到,根据那时候的主流测验理论——经典测验理论[4] ——测定一个人的真实分数的唯一方法,是让同一个人一遍又一遍地做同一套测试题,要做许多遍。[5] 让被测试者反复做题的必要性在于,据推测,每一次测验过程中,比如数学测验,都会出现一定数量的误差(原因可能是测试者分心了或是饿了;可能她读错了一两道题;也可能蒙对了)。但是如果你让测试者多次做题,并取多次成绩的平均数,那么这个平均数就反映了这个人的真实水平。

但罗德和诺维克同样充分地认识到,在实际操作中,不可能让同一个人多次做同一测验,因为人类会学习,任何做过测验(比如数学测验)的人若再次做同样的题目,都会与上一次表现不同,这种现象不可避免,因此根本不可能得到多次独立测验的成绩。[6] 但是罗德和诺维克并没有承认失败,而是提出了获取真实分数的另一种方法:不是多次测试某一个人,而是同时测试许多人。[7] 根据经典测验理论,用一个群体的分数来取代个体的多次分数是有效的。

阿道夫·凯特勒在差不多一个世纪之前,用“角斗士的雕像”第一次比喻人类平均值的意义时,就用了同样的概念演算。他宣称,同一尊士兵雕像的1000个复制品的身材平均值等于1000名现实生活中的不同士兵的身材平均值。本质上,凯特勒与罗德和诺维克均假设,多次测量同一个人与一次性测量很多人是可互换的。

这就是莫勒纳尔的顿悟时刻。他立刻意识到,罗德和诺维克奇特的假设方法不仅影响了测验,而且所有以个体为研究对象的科学领域,均以相同的假设作为研究基础。它对广大范围内的原本以为健全的科学研究方法的有效性提出了质疑,如私立学校的入学考试,天才计划和特殊需求项目的选拔过程,评估身体健康、心理健康以及患病风险的诊断测试,大脑模式,体重增加模式,家庭暴力模式,投票行为模式,抑郁症的治疗,胰岛素对治疗糖尿病的应用,招聘政策和员工考核、薪酬和晋升政策,以及学校的评分方法,等等。

这种假设相当奇怪,测量个体分布的数值可以安全替代测量群体分布的数值。然而,几乎所有研究个体的科学家都默默地接受了这一假设,虽然很多时候他们几乎意识不到这一点。但是,莫勒纳尔在做了一辈子数学心理学研究后,不经意地看到这条白纸黑字拼写出的错误假设时,他完全清楚自己看到了什么:在平均主义的最核心地带,存在一个无可辩驳的错误。

遍历性诱导转向

莫勒纳尔认为,平均主义的致命弱点在于它的假设前提自相矛盾:通过忽视个体性来了解个体。他给这个错误取了个名字:“遍历性转向”(the ergodic switch)。这个词取自数学的一个分支,那是科学界第一次讨论群体与个体的关系,这个数学领域就是遍历性理论。[8] 如果想要了解我们的学校、企业和人文科学为什么沦为一种错误思想的牺牲品,那么我们就必须了解遍历性转向是如何产生作用的。

19世纪末,物理学家正在研究气体的运动。在那个时候,物理学家可以测量气体分子的各种属性,比如一罐气体的体积、压力和温度,但是他们不知道一颗单独的气体分子是什么样子的,它是如何运动的。他们想弄明白,他们是否可以用一组气体分子的平均运动模式来预测单个气体分子的平均运动。为了解决这个问题,物理学家摸索出了一套数学原理,即遍历性理论。这个理论详细说明了,在什么样的情况下,你可以用群体的信息来得出有关群体中某一个体的相关信息。[9]

这个规则相当简单明了。根据遍历性理论,如果两个条件成立的话,你就可以用群体的平均值来预测个体。这两个条件是:(1)群体中的每一个体都是相同的;(2)群体中的所有个体都将保持不变。[10] 如果某个特定群体同时满足了这两个条件,那么这个群体就具有“遍历性”。只有在这种情况下,用群体的平均行为来预测个体行为才成立。然而事实上,对于19世纪的物理学家来说,大多数的气体分子事实上都不具有遍历性,不管它们看起来有多么简单。[11]

当然,你不必非要成为科学家才能看出来人也不具有遍历性。“如果要用群体平均值来衡量个体,除非人类都是被冷冻的克隆体,完全相同且不会改变,”莫勒纳尔给我解释道[12] ,“但是很显然,人们不是被冷冻的克隆体。”然而,即使是最基础的平均主义方法,如排名和分类,都在假设人是被冷冻的克隆体。这就是为什么莫勒纳尔将这种前提假设称为遍历性转向:它把非遍历性的事物当作遍历性的事物。我们也可以将遍历性转向看作某种聪明的“诱导转向”,平均主义诱导科学家、教育者、企业领导者、招聘经理以及医生相信,通过将个体与平均值相比较,就能得到与之相关的有意义的东西,然而他们却忽略了与之相关的所有重要的东西。

举个例子或许可以帮助我们理解遍历性转向的实际后果。想象一下,你想要通过减慢自己在键盘上打字的速度来降低打字的出错率。如果用平均主义的方法来解决这个问题,就需要评估许多不同人的打字技巧,将平均打字速度与平均错误数量进行比较。如果这样做,你会发现通常打字速度越快,出错率就越低。这就出现遍历性转向了。平均主义者会做出如下结论:如果要降低打字出错率,那么就应该加快打字速度。然而事实上,打字速度快的人通常更熟练,因此他们出错的数量就相对较少。但是这是基于“群体水平”得出的结论。如果基于个体水平来研究打字速度与出错率的关系——比如,用不同的速度打字,并测量出错的数量——那么事实上,你会发现打字速度越快,出错的数量越多。当你运用遍历性转向时——用群体信息替代个体信息——你就会得到完全错误的答案。

莫勒纳尔的顿悟同样也揭示了平均主义的原罪,这个错误在平均主义年代之初就出现了,就是凯特勒对于苏格兰士兵平均身材的解释。凯特勒宣称,他所测量出来的平均胸围实际上代表着“真正的”苏格兰士兵的胸围,并用“角斗士的雕像”对此进行解释,那时,他正是首次运用了遍历性转向。遍历性转向使他相信平均标准人的存在,更重要的是,遍历性转向还被用于证明他的假设——平均标准代表理想状态,个体则代表错误状态。

应用科学在一个半世纪里都以凯特勒最初的错误概念为基础。[13] 这就是为什么会出现诺玛雕像的尺寸没有哪个女人能符合,大脑模型匹配不了任何人的大脑,标准药物治疗法不以任何人为治疗对象,金融信用政策在处罚有信用的人,高校入学政策筛掉前途无量的学生,以及招聘政策忽视杰出人才等现象。

2004年,彼得·莫勒纳尔在题为《心理学作为个例科学的声明:回归科学心理学,直到永远》(A Manifesto on Psychology as Idiographic Science:Bringing the Person Back into Scientific Psychology,This Time Forever)的文章中,清楚地阐释了遍历性转向用于个体研究的后果。[14] 他把科学职业生涯都奉献给了平均主义,如今却宣称,平均主义错得不可救药。

“我猜你可能会说我像《圣经》里的保罗,”莫勒纳尔笑着对我说,“起初,我迫害基督徒,他们就是所有认为平均主义错误而个性才正确的同事。然后,我得到神启,自己就走到了‘通往大马士革的路上’。如今,一旦提到个人的福音书时,我就是他们最大的劝导者。”

个体科学

仅仅把福音书带给异教徒,并不意味着他们会听你的。我问莫勒纳尔,人们最初听到他的观点时如何反应,他回答道:“与大多数试图替代或只是轻微修正一下固有观念的努力一样,人们对这些论点常常置若罔闻。更为激进的努力也都是徒劳的。”[15]

在发表了他的个性宣言后不久,莫勒纳尔在一所大学里做了有关宣言详情的演讲,号召人们摒弃平均主义。一位心理学家以摇头来回应,并公然宣称:“你在制造混乱!”[16] 每当莫勒纳尔指出平均主义核心存在不可调和的错误时,心理测量学家和社会科学家就会产生这种情绪反应。没有人怀疑莫勒纳尔的数学运算。事实上公平地说,许多科学家和教育者的职业生涯都受到遍历性转向的影响,但是他们并没有接受遍历性理论的所有细节。但是,即使那些懂得数学且认可莫勒纳尔结论的人,也表达了同样的担心:如果不用平均标准来进行评估、制定模型和挑选个体,那么……能用什么方法呢?

现实中的反对声凸显出了平均主义为什么持续时间会如此之长,扎根社会能如此之深,同时,企业、高校、政府和军队对它的接受度如此之高的原因:因为平均主义比其他方法都更好用。毕竟,分类、排名以及平均标准运用起来十分方便。人们不用花多少精力就可以说,“她比普通人更聪明”,或者“他在毕业班里排名第二”,或者“她性格内向”。这类简明扼要的陈述句听上去很真实,因为它们似乎都是以简单明了的数学运算为基础的。这就是为什么平均主义对工业时代来说是完美的哲学。在那个年代里,不论是企业还是学校的管理者,都需要一种行之有效的方法来筛选大量的人员,并在标准化分阶层的系统里,为他们找到合适的位置。平均标准为人们迅速做决定提供了稳定、透明、合理的方法。即使高校行政人员和人力资源管理者口头上承认,对学生和员工排名存在问题,然而没有哪个管理者会因为拿个人与平均水平相比较而丢掉工作。

同事对自己提出的个性宣言心存疑虑是有道理的:如果不能用平均主义,那应该用什么方法呢?在听到同事的反应后,莫勒纳尔意识到,用复杂的数学运算来证明平均主义是错误的,这还不够。如果他真的想彻底地推翻平均主义的暴政,就必须找出平均主义的替代物——某种比排名和分类更行之有效的理解个体的方法。

莫勒纳尔找到他的上司、阿姆斯特丹大学研究生学院的院长,激动地告诉她,自己打算开发评价和研究个体的方法,构建新的科学体系。他列出了几个新项目,包括召开有关个性的国际学术会议,希望她能资助这些项目。

“你知道,我不能再给你新的资源了,”院长无可奈何地拒绝了他,“你还有三年就要退休了。我很遗憾,彼得,你知道我们系统的规则,我无能为力。”[17]

突然间,莫勒纳尔不得不反观自己。在60岁这一年,他发现自己可以为科学做出巨大贡献,这很有可能会改变社会的基本结构。然而,掀起革命是年轻人的游戏,而荷兰高校教育系统不会为他的宏伟壮志提供任何支持。他问自己,他是否真的愿意为此一战?

莫勒纳尔曾想过听天由命——毕竟,他的职业生涯非常成功,而且现在已快到结束的时候了。即使他决定引领改变科学游戏规则的运动,也需要潜心钻研多年,还要与科学家和社会机构做无数次斗争。然而,他并未做过多考虑。莫勒纳尔告诉我:“当认识到当务之急是什么,将对社会产生多大的影响,我就必须尽力寻求答案。”[18]

为了实现创造平均主义替代品的梦想,他开始在阿姆斯特丹大学之外寻找机会。2005年,机会来了。在大西洋的对岸,宾夕法尼亚州州立大学(Pennsylvania State University)为他提供了终身教授的职位,不久,又任命他为社会科学研究院定量发展系统方法论(Quantitative Developmental Systems Methodology)中心的创始主任。他根据自己的意愿组建研究团队,从世界各地招募了一群持相同观点的顶尖科学家和研究生。他们聚集在宾夕法尼亚州州立大学,聚集在莫勒纳尔的身边。很快,他们就亲切地称莫勒纳尔为“大师”。他们齐心协力,为寻找具有可操作性的平均主义替代品——关于个体的交叉学科——打下了坚实的基础。

让我们回顾一下平均主义年代的两个最典型的假设前提。一个是凯特勒的论点:平均标准就是理想状态,个体即是错误;一个是高尔顿的论点:如果一个人在某个方面表现优秀,那么他很可能在其他方面都很优秀。与之相反,这门个体科学的主要假设前提是:个性很重要[19] ;个体不是错误;许多最重要的人文素质(如天资、智力、品格和性格)不能被简化为一个分数。

在新的假设前提的基础上,莫勒纳尔和他的同事们开始研发新的工具,帮助科学家、医生、教育者和企业家改进评价个人的方法。这些工具使用的数学运算方法与平均主义者所使用的完全不同。平均主义的数学运算被称为统计学,因为这是基于静态值的数学运算——稳定不变的固定值。但是莫勒纳尔和他的同事认为,为了准确地了解个人,就应该使用一种截然不同的数学运算方法,如动态系统——基于变化的、非线性的动态值的数学运算。[20]

既然个体科学的假设前提和数学运算方法与平均主义的截然不同,那么毫无意外,个体科学首先将矛头对准了研究个体的方法。

先分析,后集合

平均主义最主要的研究方法是“先集合,后分析”:首先,将许多人聚集起来,找出这个群体的模式;再运用这些群体模式(比如求平均值或其他数据)来对个体进行分析和建模。[21] 与之相反的是,个体科学要求科学家“先分析,后集合”:首先,找到每一个个体的内部模式,再用合适的方式将个体模式集合起来,进行群体观察。有一个发展心理学的例子说明了如何运用“个体第一位”的方法来研究人,从而推翻早已存在的对人类天性的论断。

从20世纪30年代至80年代,研究婴儿发育的科学家们一直在努力解决一个叫作“踏步反射”(Stepping Reflex)的谜团。当新生儿被直立抱着的时候,他的腿就会上下移动,就像在走路似的。长期以来,科学家们认为这种踏步反射证明了人的行走本能。然而,这种反射行为之所以如此神秘,是因为当婴儿长到2个月左右的时候,这种反射现象就会消失。当你抱起大月龄的孩子,他的腿多半会保持不动。但随后,就在婴儿开始走路之前不久,踏步反射又会奇迹般地再次出现。是什么原因导致这种反射现象的出现、消失和再次出现呢?

科学家首先试图用传统的平均主义方法来解开踏步反射的奥秘,也就是先集合,后分析。所有人都推测踏步反射与神经系统的发育相关,于是科学家们检查了大量的婴儿,计算出踏步反射出现和消失的平均年龄,然后将这些平均年龄与神经系统发育的重要阶段相比较。他们发现有一个神经发育阶段看起来与踏步反射的出现和消失相关:髓鞘的形成,即神经系统长出保护层的生理过程。因此,科学家提出了“髓鞘化理论”:每个婴儿天生就有踏步反射,但是作为控制马达的大脑开始出现髓鞘时,该反射现象就会消失。然后,当大脑的控制中心进一步发育后,婴儿便重新获得了有意识的反射控制。[22]

到了20世纪60年代初,髓鞘化理论成为踏步反射的标准医学解释,它甚至成为神经疾病的诊断依据:如果一个婴儿的踏步反射没有按时消失,医生和神经学家就会警告家长,他们的孩子可能患有某种神经残疾。[23] 许多儿科学家和儿童心理学家断言,父母鼓励孩子做踏步反射并不可取,认为这样做可能会耽误正常的发育,引起神经肌肉异常。

虽然髓鞘化理论难以理解也不好操作,但是它却在后来几十年的时间里占据了美国幼儿科学的统治地位。如果不是一位年轻的生物学家埃瑟·泰伦(Ester Thelen)[24] ,这种理论甚至可能会一直延续到21世纪。泰伦在职业生涯早期研究的是动物,她发现许多生物学家对动物的本能行为的研究方式僵化死板,而事实上,这些行为都存在很大的变数,很大程度上取决于每个动物个体的独特习惯。这些格式化的专业经验促使她去学习动态数学,最终她决定重新研究人类的踏步反射,并将研究重点放在每一个孩子身上。

泰伦历时两年研究了40个婴儿。她每天都会给每一个宝宝照相,检查他们的身体发育情况。她把他们抱在跑步机上,把他们放在不同的位置来分析每一个宝宝的各项运动机能。最终,她提出了新的假设:导致踏步反射消失的原因是胖乎乎的大腿。

她注意到,体重增长较慢的婴儿,蹬腿动作会更多且持续时间更长;体重增加较快的婴儿往往较早就失去了踏步反射,这只是因为他们的腿部肌肉没有强壮到足以支撑起腿部。这并不是说,大腿肥胖程度是关键原因,事实上,身体发育的速度才是关键,真正重要的是体脂成分与肌肉强度的关系。[25] 这就是为什么以前的科学家只是简单地比较了平均年龄和平均体重,却没有任何发现。先集合、后分析的方法掩盖了每一个孩子的独特发育模式。泰伦运用先分析、后集合的方法,最终找到了原因。

不用说,对于踏步反射的许多科学解释中,从来就没有出现过“胖乎乎的大腿”,因此才会有那么多的科学家立即否定了这个观点。但是,泰伦设计了一系列巧妙的实验,证明了大腿肥胖理由的正确性是毋庸置疑的。她把婴儿放进水里,接着,踏步反射再次出现了,即使大腿最胖的婴儿也再次踏步了。她还给婴儿的腿部增加不同的重量,并准确地预测出了哪些婴儿会失去踏步反射。[26]

泰伦的研究对象是每一个婴儿个体,她规避掉平均主义研究者所谓的婴儿大脑可能存在问题的这种说法,并给出了解释,她告诉家长,他们真正应该关心的是婴儿的大腿是不是不结实。

在宾夕法尼亚州州立大学里,彼得·莫勒纳尔和他的中心已经证明了很多相似的发现,用“个人第一位”的研究方法得出的结果,优于仅依靠计算群体平均值的研究方法。但是有一个难题摆在“个人第一位”方法的面前,即它需要大量的数据,比平均主义方法所需的数据多得多。在研究人类的大多数领域里,在100年前、50年前,甚至25年前,我们都不具备有效的工具来获取并处理“先分析,后集合”所需的庞大数据。在工业时代,平均主义方法是当时技术发展的最高水平,而“个人第一位”的方法往往只是幻想。然而,如今我们生活在数字时代,在过去的10年中,获取、存储和处理海量个体数据的能力已经变得非常方便,而且十分普及了。

现在唯一缺少的,就是运用它的心态。

个性很重要

当吉尔伯特·S.丹尼尔斯中尉第一次提出飞机驾驶舱需要适应每一个飞行员,而非标准飞行员时,这似乎是不可能完成的任务。如今,那些曾经表示无法完成任务的企业,正将可调节的飞机驾驶舱作为卖点。[27] 同样,埃瑟·泰伦决定通过研究婴儿的个性特征,挑战根深蒂固的髓鞘化理论,似乎非常困难,甚至可能毫无意义。但是,她并没有花多长时间就注意到了胖乎乎的大腿所发挥的作用。

平均主义限制我们思想的程度难以想象——我们自身基本上不会意识到,因为我们得出的观点似乎都不言而喻且非常合理。我们的世界鼓励——不,是要求——我们将自己与一大堆平均数进行比较,并为此提供了无数的理由。我们要将自己的工资与平均工资做比较,以便判断事业成功与否;我们要将自己的结婚年龄与平均结婚年龄相比较,以便判断自己是否结婚太早或太晚。但是,一旦你从平均主义思维中解放出来,那些以前看起来不可能的事都会变得直观,然后变得明朗。

对莫勒纳尔说“你在制造混乱”的那位心理学家,人们很容易对其表示同情。要想放弃平均主义似乎并不容易,这需要勇敢地走出已知世界。当你周围的整个世界都稳稳地停留在平均主义的土地上时,这个建议就显得格外鲁莽了。但我们没有必要在黑暗中继续盲目地摸索。在本书的第二部分里,我将分享有关个体科学的三个原则,即锯齿原则、情境原则(范围原则)以及途径原则,并将取代你长久以来依赖的平均主义。这三个原则将帮助你运用全新的方式来评价、选择和了解个人;帮你摒弃分类和排名,发现自己生命中真正的个性模式;并将帮助你彻底地消除平均主义不可挑战的权威性。

《平均的终结:如何在崇尚标准化的世界中胜出》