推理的迷宫：悖论、谜题及知识的脆弱性:第7章不可能性：期望悖论_在线免费阅读

你是一所大学的心理学系主任，正在主持一次奇怪的实验，实验对象是人。一个人A坐在桌边，接受心理学考试；另一个人B坐在他对面，监视他的进展。B面前有一个按钮。B被告知，摁下这个按钮将使A受到惩戒性的、痛苦的电击（但是不会造成永久性伤害）。琼斯教授会定时走到A的旁边，指出一个错误答案，然后指示B摁下按钮。

实际上A是琼斯教授的同伙。按钮没有接通任何东西，当按钮被摁下时，A假装很痛苦。琼斯进行这次实验的唯一目的是测试B，看他是否会执行“惩罚”A的命令。琼斯的一贯主张是，在权威人物的授意下，大多数人会执行残酷的命令。琼斯在10个不同的B身上做过实验，其中8个人摁下了按钮。

琼斯教授没有意识到，他本人正处于卡夫卡式的陷阱中：他，琼斯本人，其实是你的实验对象。你的兴趣是研究心理学实验中的“附加因素”，即“实验者偏见效应”。在心理学实验中，当一个研究者期望某个特定结果时，他得到这种结果的可能性更大。研究倾向于支持研究者的一贯主张——这意味着研究过程有问题。

换一种研究方法，可以消减或消除实验者偏见效应。在检验新药的实验中，实验以“双盲”方式进行，一些实验对象服用新药，另一些实验对象服用安慰剂（不含任何有效成分）。在结果出来以前，实验对象和实验者都不知道对方的情况。这种设计防止了实验者对新药的热情感染服药者。

但是在某些心理学研究中，双盲设计几乎不可能。实验者必须知道正在发生的情况。他期望他的实验对象变得像纳粹一样凶残，于是，大多数实验对象果然如其所愿。相反，另一个实验者史密斯教授相信人本性善良，做了相同的实验，并报告说，在10个实验对象中只有一个人摁下了按钮。这不是有意欺骗，这是在潜意识下进行的欺骗。史密斯和琼斯都倾向于按照对自己有利的方式解释模棱两可的结果。当琼斯让其实验对象摁下按钮之时，其态度比史密斯更严厉、更专横。二者在选择实验对象B时都可能有意挑选特定的人以获得期望的结果。这两位研究者都没有意识到这一点，但是他们创造的预言具备自我实现的力量。

如果实验者偏见效应比较强，那么对实验对象的研究将会受到强烈的影响。假设你说服了一个大基金会资助你的实验，你的实验对象是其他一些对实际情况一无所知的心理学家。这个基金会给你足够多的钱，你可以资助琼斯、史密斯以及许多其他的研究者。你并不关心这些人在他们自己的实验中发现什么，你唯一的目的是检验存在于研究者的偏见和他的结果之间的可疑的相关性。你已经观察了许多心理学家，他们个性各异，都在对不知情的人类实验对象进行各种类型的一切可设想的实验。证据是明显的：实验者偏见效应巨大而普遍。在90%的情况下，心理学实验的结果就是实验者期望的结果。

现在问题出现了。这个结果本身正是你所期望的。如果你的研究是正确的，那么针对人类实验对象的心理学实验结果就是无效的。你的研究也是一个针对人类实验对象的心理学实验，因此，你的研究是无效的。但是如果你的研究无效，我们就没有理由相信实验者偏见效应，而你的研究也很可能是有效的，因为你的研究揭示了无效的研究……

第22条军规

小仲马（Alexandre Dumas Fls）说过：“所有全称命题都是危险的，包括本命题在内。”这句话与上文的讨论相比，不仅有表面上的相似性，而且，“期望悖论”也令我们回想起约瑟夫·海勒（Joseph Heller）在《第22条军规》中描述的悖论性的情景：

只有一条军规（即第22条）具体提到，面对真实而紧迫的危险时，心智健全对个人的自身安全是至关重要的。奥尔疯了，因此他可以停飞。他需要做的只是提出要求。他一旦提出要求，就说明他不是疯子了，他必须继续执行任务。如果他继续执行任务，他就是疯子；如果他停止执行任务，他就是心智健全的。如果他是心智健全的，他就不得不继续执行任务。如果他继续执行任务，那么他就是疯子，他就不必执行任务了；但是如果他不想执行任务，就说明他心智健全，必须继续执行任务。

比较一下普罗泰戈拉（Protagoras，约公元前480年—公元前411年）的著名故事（这个故事很可能是假的）。普罗泰戈拉是智者学派的开创者，也是古希腊最早的收费教师。一个跟随他学法律的学生和他达成协议：学生在打赢第一场官司之后将支付学费。这个学生不受理案件，想以此逃避交学费。普罗泰戈拉不得不起诉学生以讨回学费，学生则为自己辩护。如果学生输了，他不必付学费；如果他赢了，他也不必付学费。

（无论如何，故事就是这么讲的。也许有人这样设想：如果学生在他“是否可以推迟受理第一场官司”这个问题上赢得胜利，那么普罗泰戈拉可以立刻向学生索取学费，有必要的话，他可以再次起诉，因为学生已经板上钉钉地违约了。）

以上这些悖论的一个共同之处是，悖论中有一个概念（或集合）可以自我包含。期望悖论的症结在于，这个实验研究的是以人作为对象的这一类实验，而这个实验本身就属于这一类别。关于包含自身作为元素的集合，最经典的表述是罗素的“理发师悖论”：在某个镇上，理发师给每个不自己刮胡子的人刮胡子。更确切地说，他给且仅给不自己刮胡子的人刮胡子。那么，他是否给自己刮胡子呢？这时，这个理发师无法遵行这个规定。如果他不给自己刮胡子，他就必须给自己刮胡子；如果他给自己刮胡子，他就不能给自己刮胡子。

以上这些都是伪装成谜题的悖论。乍一看似乎有个答案等待被发现，而一旦你找到了答案，你会说：“啊哈！就是这么回事！”但是，随后你会发现这个答案站不住脚。无论你怎么想，结果都是不可能的。

这样的事有可能吗？

面对这类悖论，一种常见的反应是怀疑它们是否“可能”，也就是说，它们是否可能在真实世界中发生。在某些场合，答案是一个肯定的“是”。普罗泰戈拉的诉讼有可能发生（法官会面临困难的抉择）；军方可能制定令人糊涂的、自相矛盾的规定（这样的规定很可能已经有了）。某个理发师可能为镇里除他本人以外的每一个不给自己刮胡子的人刮胡子——这使得大家对他做出了一个与罗素的说法一样的判断，虽然他还是不能真正地符合这个判断。

实验者偏见效应已经得到了真实实验的支持。（人们甚至为“实验者偏见效应”创造了一个专门的字母缩写：Ebe。）1963年，罗伯特·罗森塔尔（Robert Rosenthal）和福德（K. Fode）报告说，有三个研究显示了显著的实验者偏见效应。罗森塔尔和福德指派许多大学生去进行以人作为实验对象的假实验。他们向实验对象出示不同种类的人的照片，让实验对象判断照片上的人正在“经历成功”还是正在“经历失败”。大约一半主持实验的学生受到引导并相信他们的实验对象将倾向于回答“成功”；其他的学生则受到引导并期待他们的实验对象回答“失败”。最后，对假实验的实验报告进行比较。由于每次假实验获得的结果应当相同，所以如果结果有差异，则应当认为差异是由实验者的期望造成的。罗森塔尔后来进行的研究进一步探索了实验者偏见效应。罗森塔尔极其关注这种效应，甚至主张未来的针对人类的实验也许不得不由自动化的程序引导，以避免这种效应带来的偏差。

其他研究者无法再现罗森塔尔的发现。1969年的《咨询与临床心理学杂志》把争论推向高潮。这份杂志接连发表了一系列文章：西奥多·色诺芬·巴伯（Theodore Enophon Barber）及其同事仔细地重复了罗森塔尔的实验，但是发现完全没有支持实验者偏见效应的证据。于是，罗森塔尔进行辩护性的反驳，巴伯又发表了火药味十足的反驳。双方在学术上的吹毛求疵演变为暴躁的潜流，最后导致了这样一个冷冰冰的声明：“罗森塔尔主张实验者偏见效应在男女混校的州立大学比在其他类型的大学或学院更易于发现，如果他的主张是严肃的，他应当拿出证据支持这个主张。”（罗森塔尔反驳巴伯说，巴伯的重复实验是在女子学院进行的，对此巴伯做出了如上回应。）

随后的实验进一步削弱了显著的实验者偏见效应的证据。1968到1976年，至少有40项研究显示，不存在统计上的明显的实验者偏见效应，另外6项研究发现了实验者偏见效应的较弱的证据。

为了使期望悖论在现实世界中存在，必须确保期望效应既普遍有效又无法避免。如果只是某些心理学家受到这种效应的影响，不会产生问题。这样，实验者本人可以是一个小心谨慎、头脑冷静的心理学家，而他的同事马马虎虎，他可以研究同事的失误。正如“所有克里特人都说谎”这个悖论要求有一个克里特人把它说出来，所有此类实验的不可靠性也需要一个同类的实验表达。

在现实中，期望效应不大可能表现为普遍的现象。因此，即使某个实际研究宣称发现了这种效应，这个研究本身也未必会陷入悖论的旋涡。

但是，如果某个实验真的确定了“所有针对人类的实验得出的结果都是无效的”这个结论——包括确定这个结论的实验本身在内，将会如何呢？这有可能发生吗？[1]

“假”和“无效”是有差别的。如果一个实验的结果是假的，它就是假的。但是，如果这个实验仅仅是无效的（由于粗心的操作、缺乏控制等），那么它的结果可能是真的，也可能是假的。一个无效的实验可以支持一个碰巧为真的假说（我们可称之为“盖梯尔实验”）。

对于说谎者悖论，假定其为真，则推出其假，而假定其为假，则推出其真。但是在这里，我们讨论的是期望效应实验的真/假，还是有效/无效？问题并非一目了然。我们先列出所有的可能性，就像处理逻辑谜题一样。

（a）假定研究结果为真。如果它是真的，就意味着针对人类的心理学实验是不可信的。（这并不是说这些心理学实验得出的结果必然是错误的，只是说这些结论不能完全从实验中得出。）因此，本研究本身也是不可信的。其结论可能是真的——我们其实已假定其为真，但是本研究并不构成其结论的有效证据。这个研究是一个盖梯尔实验。这种情况不无讽刺意味，但它的确是一种可能状态。

（b）假定研究结果为假。也就是说，不存在普遍的期望效应。这个研究结果可能为假，它应当由于其他原因为假。（如果结论为假，那么研究就一定是无效的。）这又是一种可能状态。

（c）假定研究是有效的。于是，结论是真的，而且实验是无效的——这是矛盾的。

（d）假定研究无效。于是，结论可真亦可假：没有矛盾。

简单地说，如果某人做了一个研究，表明实验者偏见效应是普遍存在的，那么有以下三种可能：结论碰巧是真的，但是研究是无效的，研究不足以支持其结论，这属于情况（a）；结论是假的，研究无效，这属于情况（b）；研究是无效的，真假不定，这属于情况（d）。以上三种批评都是合理的。无论如何，三种情况都表明：研究是无效的。

但是，如果有一群获得过诺贝尔奖的科学家组成了一个委员会，由这个委员会指导该研究，付出了最大的努力以确保研究的有效性，我们该如何评价此项研究呢？他们设计了前所未有的严谨的研究体系，包括细致的控制、统计检验、仔细地校验各个环节，以保证研究无可置疑地有效，并且正确地断言：所有针对人类的心理学实验（包括本研究在内）都因潜意识的实验者偏差而无效。

这个问题的核心其实就是说谎者悖论，只不过把“真”替换成“有效”了。一个有效的研究恰好断言其自身的有效性是不可能的。我们的讨论进入了探讨不可能性的领域。

可能世界

“可能世界”是哲学中的一个非常著名的概念。为什么世界是这个样子的？这是一个很自然的问题。为什么会有邪恶？我们能提出这个问题就足以说明，我们可以设想一个没有邪恶的世界，这个世界与真实存在的世界截然不同。我们有理由认为，这种构想“可能世界”的能力是人类智力的最基本的部分之一。我们在生活中做出了无数的选择，所有这些选择无论大小都以想象力为基础。你想象了一个世界，在这个世界里，你在今天下午洗了车；你又想象了另一个世界，在那个世界里，你在今天下午没洗车。比较这两个“可能世界”，然后决定你更乐意生活于哪一个当中。

第一个广泛使用“可能世界”这个概念的西方著述者是德国数学家、哲学家莱布尼茨（Gottfried Leibniz，1646—1716）。莱布尼茨感到奇怪，为什么上帝在创造世界的时候在所有的“可能世界”中选择了这一个。莱布尼茨给出了一个独特的答案：因为这个世界实际上就是所有的“可能世界”中最好的一个。他设想，这个世界中的痛苦和不幸达到绝对意义上的最小值。在造物主那里做出的任何一点改动，任何希望在这里或那里做一点儿修正的企图，都将把整个世界变糟。这种难以置信的观点再现于伏尔泰的讽刺小说《老实人康迪德》（Candide）中，书中人物潘格洛斯博士（Dr. Pangloss）受到莱布尼兹的启发。康迪德无法相信，一个没有发生过里斯本地震（1755年，4万人丧生）的世界怎么会不如我们的真实世界好。

20世纪60年代，索尔·克里普克（Saul Kripke）、戴维·刘易斯（David Lewis）、拉科·欣蒂卡（Jaakko Hintikka）等哲学家复兴了可能世界哲学。为了避免误解，我们澄清一下什么是“可能世界”。它指的不是在宇宙中的另一个星球。一个“可能世界”是一个完整的宇宙，它有自己的过去、现在和未来。我们可以谈论一个德国人打赢了“二战”的“可能世界”，我们甚至可以谈论那个“可能世界”的公元1万年。人们经常用单数的“可能世界”表示实际上的一类“可能世界”。一定存在着不止亿万个德国人打赢了“二战”的“可能世界”，其中的每一个都在某些细节上与其他的不同。存在着（或者说看来存在着）无穷多个“可能世界”。我们生活于其中的那一个“可能世界”被称为“真实”世界。

即使这样一个纯哲学的概念也有其限度。如果任何一种随意的想象都构成一个“可能世界”，那么这个概念也就没什么用处了。多数哲学家同意，谈论一个并非“可能世界”的世界是有可能的。

虽然我们可以说出这样一个句子：“1+1不等于2的世界”，但是这并没有描述一个“可能世界”。类似地，“6是质数的世界”、“有四条边的五边形的世界”、“里斯本地震既发生过又没发生过的世界”、“林肯比斯大林个头高、斯大林比拿破仑个头高并且拿破仑比林肯个头高的世界”都不表达可能世界。

（有人对此表示异议。虽然任何人都无法设想一个1+1不等于2的世界将是什么样的，但是冥顽不化的怀疑论者还是可以提出疑问：我们怎么能保证这样一个世界是不可能存在的呢？大多数关于“可能世界”的哲学讨论都遵循一个基本规则：我们的逻辑在其他“可能世界”中无论如何也会生效。不然，我们就没法思考它们了。）

有多少个“可能世界”

说某事是不可能的（不同于仅仅是假的）意味着在任何一个“可能世界”中它都不能为真。有多少个不同的“可能世界”？这是哲学中最深刻的问题之一。

索尔·克里普克主张，像“金的原子序数是79”这样的事实在任何“可能世界”中都是真的。大多数人则认为这种观点难以接受。看来很容易想象一个世界，其中金的原子序数是78、80或17。关于金的原子序数，在你整个一生中你很可能从来都不知道，或者没在乎过。表面看来，想象一个金的原子序数不同的世界与想象一个你的电话号码或车牌照改变了的世界没什么两样。真是这样吗？

根据元素在周期表中的位置可以推测其性质。在表中，金位于银和铜之下，而性质与这二者在许多方面相似：密度大、柔软、惰性、金属类、导电性极好。如果金的原子序数加1或减1它在周期表中的位置会变化，而性质也应当不同。

假设金的原子序数是78。在周期表中它将位于镍和钯下面，而性质应与这二者相似。它应当还是密度大的金属，但是性质会更接近铝（实际上铝的原子序数是78）。如果“金”在所有方面与铝相似，它还是金吗？

你可以坚持说，在周期表中其他元素的原子序数也会减1，于是金的相对位置保持不变。金是78号元素、铝是77号元素，以此类推。但是如果这样，在周期表的开端将不得不删掉一个元素。被删掉的应当是氢，这种元素构成恒星，目前是宇宙中最普遍的元素。一个没有氢元素的宇宙是如此的奇异，以至于我们甚至无法相信它有多奇异。

克里普克断言，从化学家的角度说，元素的属性或多或少地、不可避免地由其原子序数决定。设想在某个世界中氦不是惰性气体与设想在某个世界中1+1不等于2没有太大差别。确定一下，某个世界是否可能不像其表面看起来那么简单！

也许有一天，我们的物理知识会达到与化学同样完备的程度。也许电子、夸克、光子的属性遵循某些根本的原则，就像化学元素排列符合周期表一样——是可以设想的。“超弦”理论试图提供这样的理论。如果这类理论是正确的，许多似乎可能的奇异世界（例如质子比中子质量大的世界，电子的尺寸如同高尔夫球大小的世界等）也许会被排除。物理学家甚至怀疑，真实世界就是唯一的“可能世界”。物理定律，甚至世界的初始状态也许已经被严格的逻辑预先规定了，我们几乎没有设想的余地。

悖论和可能世界

“这个句子是假的”是一个悖论——当我们做出这个断言时，意思是说，在任何一个“可能世界”中这个语句都不能正确地描述自身。我们可以从两个方面分析：（1）如果这个句子是真的，那么这个句子是假的；（2）如果这个句子是假的，那么这个句子是真的。我们可以任意设想在某个世界中这个句子是真的或者假的，但是无论怎么设想，都会导致矛盾。

拉科·欣蒂卡利用“可能世界”定义知识。增加一个人的知识就意味着减少与此人的知识相容的“可能世界”的数量。例如，我们知道的所有事情都与半人马座阿尔法星系内存在生命相容；同时，我们知道的所有事情都与半人马座阿尔法星系内不存在生命相容。也就是说，如果有一个世界在各方面都与我们的真实世界相同，唯独在半人马座阿尔法星系内是否存在生命这一点上与我们的真实世界不同，我们的知识不足以鉴别这两个世界有何差别。而一旦我们知道了实际上半人马座阿尔法星系内是否存在生命，就有一半的可能性被排除掉了。

科学发现消减相容的“可能世界”的数量。我们很自然地想问，这个消减的过程可以进行到什么程度。在欣蒂卡看来，完全知识意味着彻底排除所有的“可能世界”，只剩下一个世界——即真实世界。

请注意全知与悖论之间的微弱差别。对于一个完全无知的人来说，与他的知识相容的“可能世界”的数目有无穷多；对于一个拥有完全知识的人来说，“可能世界”的数目被限制为一个。如果“可能世界”的数目被限制为0，会怎么样呢？某个人遭遇了这样一种困境：他发现所有的“可能世界”都与他的知识矛盾，他的已知事实集合包含矛盾。看来悖论顶多只能证明这不是一个“可能世界”。

博尔赫斯在《乌龟的化身》一文中推测，悖论作为线索揭示了世界是不真实的：

让我们认可唯心主义的主张：世界在本质上是虚幻的；同时，让我们采取非唯心主义的方法：寻找世界是非真实性的证据来证实世界的虚幻本性。我认为，在康德的二律背反和芝诺的矛盾中可以发现这样的证据。
“最伟大的魔法师（诺瓦利斯令人难忘地记录过）可以向自己施展法术，其法术如此高超，以至于他本人在魔法的控制之下而浑然不觉，以为自己在自由地行事。我们不就处于这种状态中吗？”我猜想情况就是这样。完满的神在我们体内驱使我们，令我们梦到了世界。我们梦到一个稳固、神秘、可见的世界，它在空间中弥漫、在时间中延续；但是我们承认，在这个世界的结构中存在细微而永远无法修补的非理性的裂缝，这些裂缝告诉我们，所谓的这个世界其实是个梦。

序言悖论

我们都见过谦虚得过分的序言——作者（在感谢自己的配偶和打字员之后）声明对“在所难免”的错误负责。你很可能觉得奇怪，既然他对于错误的存在如此有把握，为什么他不回去把错误改过来，而只是做一个空洞的说明。受这种“不作为”现象的启发，梅金森（D. C. Makinson）提出了“序言悖论”（1965）。这个悖论与期望悖论和意外绞刑悖论都有联系，它“证明了”除非是在文学作品中，否则这种情况不能发生。

一位作者写了一部巨著，他认为此书属于非文学作品。书中有许多命题，他仔细地检查过这些命题。一位朋友读了这本书，耸耸肩说：“任何一部篇幅如此长的书中至少有一处错误。”“在哪儿呢？”作者要求朋友指出来。但朋友断言，虽然他还没发现任何错误，但是所有的长篇非文学类著作都会包含一两个错误。作者勉强接受了朋友的说法。朋友说：“这么说，你的读者没有理由相信你书中的全部命题。”

“你看，”朋友说，“随便挑出一个命题。”他随机地翻到一页，找到一个陈述句。“我们暂且不看这个命题。我用手指挡住这个命题，让你看不见它。你是否相信，在这本书中除了这个命题以外的所有命题都是真的？”

“当然。除非我信以为真，否则我不会把命题写进书中。我有非常合理的理由相信它们。”

“好极了。你已经同意：这本书中至少包含一个错误，尽管你我都未能发现错误。既然你相信书中至少有一处错误，而且你相信除了这个命题以外的所有命题都是真的，于是，你必须相信我正用手指挡着的这个命题是假的，否则你的观念就是自相矛盾的。我只是随便挑出了一个命题做例子。其实我可以把任何一个命题拿出来，进行完全相同的推理。对于书中的任何一个命题，你都不能合理地相信它是真的。”朋友下了结论。

为了避免误导读者，这个作者为这本书加了一个序言作为警告：“本书中至少有一个命题是错误的。”

如果这本书中包含一个（或多个）错误，则这个作为序言的命题是正确的。如果这本书中除了这个作为序言的命题以外没有任何错误，则这个作为序言的命题就是错误的。于是，这本书中确实有一个错误，而作为序言的命题是正确的。但是如果作为序言的命题是正确的，那么本书中就没有错误，作为序言的命题就是错误的……在再版时插入一系列的勘误表也无助于解决这个问题！[2]

合理的观念必须是相容的吗？

确实有许多作者在实际的序言中承认有错误。小库尔特·冯内古特（Kurt Vonnegut Jr.）的小说《猫的摇篮》就有这样一篇序言：“本书中的东西统统是假的。”这与梅金森的序言悖论不一样，它是更直接的矛盾。不过好在冯内古特的书是文学作品，只要这个序言不应用于自身，它还是正确的。按理说，这个序言本身是真正的冯内古特（而非小说中的人物）写的，所以序言不是文学性的。当序言涉及自身时，就产生了一个说谎者悖论。

序言悖论使我们回想起数学家威廉·尚克斯毕生悲剧性的工作。他一生致力于计算圆周率，他在计算第528位小数时出了错，导致以后的全部工作都无效了。设想你正在写一本名为“圆周率的数字”的书。书的第一页上写着：“圆周率的第一个有效数字是3。”此后的每一页都承续上一页记录圆周率的十进制小数的下一个数字。你用手摇计算器得出数字。你是个有水平的数学家，采用的是公认有效的算法。因此，你有理由相信自己算出的每一个数字都是对的。

当你算到第1 000位的时候，你发现，你很可能已经在计算中犯了至少一个错误。哎哟！你的处境比梅金森的序言悖论还要糟。计算新的一位数字依赖于先前的计算结果（就像在长除法中一样）。你不能直接确定圆周率的第1 000位数字，在此之前，你必须先确定第999位数字，而为此你必须确定第998位数字，依此类推。如果在计算某一位数字时出了错，那么随后的所有数字都是无效的。这就好比竖起1 000张多米诺骨牌，一旦第307张骨牌倒向右侧，其后的每一张骨牌都会倒下。如果在前1 000位数字中至少有一处错误，则第1 000位一定是错的。[3]同样，第999位、第998位以及此前的一长串数字很可能也是如此。

和期望悖论一样，序言悖论质疑了在涉及归纳概率的、没有确定性的场合下演绎推理的作用。由于科学家借重于概率更甚于确定性，这个问题值得深思。

我们的世界观由一系列观念构成，这些观念大体上是真实、合理的（至少我们是这样认为的）。序言悖论提出一个问题：在合理的观念之中是否可能包含逻辑矛盾。请注意，在悖论内部包含着悖论。书的作者有这样一个观念：书中的每一个命题单独考虑都是真的，但是以整体上来说书中一定包含错误。这个观念包含矛盾。假定这本书做出了1 000个不同的判断，这些判断都是正确的，而且相互一致；而序言中的声明（“本书中至少有一个命题是错误的”）是第1 001个判断。这就产生了一个极为奇异的矛盾：虽然全部1 001个判断构成的整体是自相矛盾的，但是从中任意取出1 000个判断，则这1 000个判断在逻辑上相互一致。

在小亨利·E·屈贝里（Henry E. Kyburg Jr.）提出的“彩票悖论”（1961）中，概率的地位更加明显。任何一个买彩票的人都不能合理地期望赢，因为结果相反的概率太大了。但是事实上总会有某个人赢，如果每个人都预计自己不会赢，则与这个事实矛盾。在实际生活中这个可疑的推理链条又向前推进了一步。“既然一定会有某个人赢，你怎么知道这个人就不是我呢？”这个想法不符合理性推断，但是国家彩票的广告词就是这么说的。屈贝里认为，一个人的合理观念的集合可能在逻辑上是矛盾的。

梅金森的序言悖论和屈贝里的彩票悖论涉及的深层问题在于，大量观念汇集在一起可能把矛盾隐藏起来。在一个由100万个命题构成的集合中，某个单独的命题可能会引入一个微妙的矛盾。请考虑这个连锁推理：

1.艾丽斯是个逻辑学家。

2.所有逻辑学家都吃猪排。

3.所有吃猪排的人都是克里特岛人。

4.所有克里特岛人都是说谎者。

5.所有说谎者都是出租车司机。

……

999 997.所有得克萨斯人都是富人。

999 998.所有富人都是不快乐的。

999 999.所有不快乐的人都吸烟。

1 000 000.艾丽斯不吸烟。

省略号表示其他前提，即第6~999 996条。其中每一个命题都是“所有的X都是Y”这种形式，我们最终可以推出，所有的逻辑学家都是吸烟者，由此得到艾丽斯吸烟。这与第100万条前提矛盾。因此，这个命题集合是不可满足的（自相矛盾的）。

没有哪个前提格外值得注意。有趣的是，去掉任何一个前提都会使得整体变成可以满足的。例如，去掉前提4，则得到艾丽斯是克里特岛人，所有说谎者都吸烟，艾丽斯不吸烟（因此艾丽斯不是说谎者）。

在这个例子中，所有前提以整齐的次序排列，因而不难看出其中的矛盾。如果这100万个前提打乱次序随机排列，要想发现其中的自相矛盾之处就非常困难了。如果其中某些命题采取了更复杂的形式，难度则更大。一个观念集合如同一个博罗梅奥环（Borromean Ring），或是那种抽出一片就使整体散架的智力玩具。每个命题的作用都会在整个集合中传播开来，对整体产生影响。

波洛克毒气室

一旦陷入悖论，人们的第一个反应是放弃一个（或更多）导致矛盾的初始假设。问题是，我们如何决定放弃哪个观念？约翰·L·波洛克（John L. Pollock）根据证实规则解决了序言悖论。他通过下面这个思想实验展示了证实规则：

一个房间有时会充满绿色的毒气。为了警告那些可能想进入的人，这个房间设计了一个警示系统。这个系统（由一个委员会设计）这样工作：通过门上的窗户可以看见房间里的一盏警示灯。当人们可以安全进入时，灯是绿色的（表示“通过”）；当房间里有致命气体时，灯是白色的（在某些亚洲国家白色代表死亡）。

糟糕的是，当房间里有毒气时，灯实际上是白色的，但是绿色的毒气使得灯看起来是绿色的，因此，这个系统无法使用。无论房间里有没有毒气，灯看起来总是绿色的。委员会设法解决了这个缺陷。在距警示灯几英寸的地方安装了一个闭路电视摄像头，视频信号传给房间外的彩色监视器。无论房间里是否有毒气，监视器都会精确地再现警示灯的颜色。在门上有一个警示牌，上面写明：“不要理会通过窗户看到的灯的颜色，以电视监视器反映的颜色为准。”

波洛克用这个组装的警示系统比喻我们关于世界的不完善的知识。灯或绿或白，但是我们不知道是绿还是白。从窗户中看，灯是绿色的。表面证据让我们相信灯是绿色的。但是在电视屏幕上，灯看来是白色的。这个理由让我们相信灯是白色的。但是灯是绿色的意味着它不能是白色的，反之亦然。在这两个原本可信的猜想中，我们必须放弃一个。

波洛克注意到，拒斥一种观念的方法不止一种。你可能会说：“通过窗户看灯是绿色的。根据经验我知道，大多数窗户是用无色玻璃做的，玻璃不会使颜色走样。空气也是无色的。因此，通过玻璃看灯是绿的便有了一个合理的理由，我相信灯是绿色的。如果灯是绿色的，那么它不能是白色的。因此它不是白色的。”

当然，你可以同样容易地做出如下推理：“从电视监视器上看，灯是白色的。物体的颜色通常与彩色电视机反映出来的一样——这就是我们买彩色电视机的全部原因。因此，从监视器上看灯是白色的是一个合理的理由，我相信灯是白色的。如果灯是白色的，那么它就不能是绿色的。因此它不是绿色的。”

这样，我们得到了一个小型的悖论。从有限的几条观察出发，推出了一个矛盾。每个推理都对另一个构成针锋相对的反驳，反驳看来是以最强烈的方式进行的。

解决方案很明显。实际上，灯一定是白色的，和电视屏幕上反映的一样。但是我们采用的不是上面的第二个推理。上面的第二个推理不见得比第一个强——也许还稍微弱一些。（当我们在电视上看到的与亲眼所见的相冲突时，我们很可能更相信自己的眼睛。）我们有另一个理由支持灯是白色的——根据房门上的警示牌。

一切经验性的观念都有可能是错误的。我们可能得知某些东西（一个败因），因而放弃了一个过去的观念——这种情况总有可能发生。有两种类型的败因：直接反驳型和釜底抽薪型。

直接反驳型的败因直截了当地指出一个观念是错误的。一旦得知在哥本哈根动物园有一群白乌鸦，这就直接反驳了“所有乌鸦都是黑色的”这个猜想。我们还是有很多证据（见到黑色乌鸦的所有目击证据）证明这个猜想，而且这些证据依然是有价值的，但是我们不得不承认这个猜想是假的。

釜底抽薪型的败因则揭示，支持此观念的证据是无效的。得知你实际上是一颗“缸中之脑”就是一个釜底抽薪型的败因，使得你相信的关于外部世界的一切东西都失效了。一个釜底抽薪型的败因使我们用一种新视角来审视支持某个猜想的证据，显示出这个证据其实不能用来证明这个观念。当然，观念本身也许碰巧还是真的，但是提供支持的证据不足。

初看起来，直接反驳型败因强于釜底抽薪型败因。但是波洛克认为，实际上釜底抽薪型败因优先于直接反驳型败因。二者的差别如同有趣的论辩与无趣的论辩之间的差别：在无趣的论辩中，针锋相对的双方各自指责对方是错误的；在有趣的论辩中，他们指出为什么对方是错误的。

关于灯的两种结论（基于从窗口获得的证据，它是绿色的；基于从电视屏幕获得的证据，它是白色的）都有经验理由支持，而二者互为对方的直接反驳型败因。这种相持不下的局面只能通过警示牌解决，警示牌属于釜底抽薪型的败因。它解释了透过绿色的毒气看见绿色的灯，灯的绿色可能是假象。这使我们有理由抛弃一个观念而坚持另一个。

釜底抽薪型败因优先的原则有助于我们理解本章中的大多数悖论（也包括意外绞刑悖论）。在序言悖论中，作者的朋友针对一个挑选出来的命题所做的论证是一个直接反驳型的败因，这个论证只是说此命题是错误的，并不解释为什么是错误的。这个论证与这个命题本身没有直接关联。实际上，这个被挡住的命题的内容从来没有进入讨论过程。

作者可以用一个釜底抽薪型败因反驳朋友的论证。朋友的推理立足于书中包含错误这一观念。我们也许有非常好的经验理由（在其他书中都发现了错误和排印问题）支持这个观念，但是，一旦我们发现事实上除了朋友挑出的命题以外，所有书中命题都是正确的，这个理由肯定会遭到破坏。如果非要认为书中一定包含一个错误，那么唯一的可能就是，朋友挑出的这个命题是错误的，但是没有理由认为，这个命题出错的可能性比其他命题更大。在必须做出选择的时候，我们应当求助釜底抽薪型败因。

序言悖论其实是一个玩笑。我们一直很清楚，朋友的推理是错误的，问题只不过是说明错在哪里。相比之下，期望悖论更难被攻破。诉诸釜底抽薪型败因，可以得到如下解决方案（当然这个方案未必是定论）：

如果一个论证指出某个实验的结果是假的，那么这个论证属于直接反驳型败因；如果一个论证指出某个实验是无效的，那么它属于釜底抽薪型败因。在关于期望效应的实验中，两种败因出现冲突。在这种情况下，根据波洛克的理论，我们应当优先考虑揭示无效性的理由，而非揭示错误性的理由。

考虑这个悖论的加强版：一个由著名科学家组成的超一流委员会指导这个实验，因而我们确信实验的有效性。直接反驳型败因是这样的：如果实验结果是真实的，那么实验必定是无效的。然而，由于我们知道实验是有效的（根据指导委员会的权威性），所以结果一定不是真实的（根据否定后件式推理）。

釜底抽薪型败因是这样的：如果实验既有效又真实，那么潜意识的期望已经危及了实验本身。这样，我们遗憾地得出结论：实验是无效的。（需要指出，在这两种败因中，后一种更有道理。）

最后讨论一下意外绞刑悖论。（当天数较多时，这个悖论与序言悖论的命题数较多的情况类似。）囚徒的推理反驳了他在一周内的任何一天被绞死的可能性（直接反驳型败因）。这样一组观念又构成了对自身进行颠覆的釜底抽薪型败因，因为刽子手在了解了囚徒的观念以后可以在任何一天行刑。釜底抽薪型败因优先的原则使我们接受奎因的结论：囚徒是错误的。

你可能会问，在什么条件下我们才能下结论说，某个命题得到了确切无疑的确立。答案是：永远不能。这说明以不可失效性作为“知道”的第四条标准是有麻烦的。任何观念都不能在败因面前免疫——包括“这是一个败因”这样的观念。

一个门卫走到波洛克毒气室门外检查监视器。他嘀咕道：“伙计，用这玩意儿警告大伙是一个天大的玩笑。除非某个人因此送了命，否则他们是不会有什么行动的。”他一边抱怨着，一边扭动显示器的旋钮调整了一下，灯泡的图像变成了鲜艳的绿色。

[1] 这个问题有点不着边际。一个由实验确立的结论只能是归纳式的结论，所以不可能有普遍性——一旦认识到这一点，这个问题就没必要讨论了。如果一定要把这个实验的结论应用于这个实验本身，那不过是外推，而外推的失败再正常不过了。——译者注

[2] 作者对序言悖论的理解和介绍与常见的版本不同。一般认为，序言悖论的要点在于“相信”。根据常识，某人既相信A又相信B，则可以推出，此人相信“A并且B”。序言悖论颠覆了这种想法。但是从作者的分析看，他显然把“相信”替换成了“是真的”。——译者注

[3] 这个数字有1/10的概率是正确的。如果它碰巧正确，则构成一个盖梯尔反例。