心理词典和心理语法

在自然界中,语法的基本原则显得并不自然。语法是一个典型的“离散组合系统”(discrete combinatorial system),即一组数量有限的离散元素(这里指的是单词)通过抽样、组合和排列,创造出一个更大的结构(这里指的是句子),而这个结构在特性上与它的构成元素完全不同。例如“人咬狗”这个句子,它在意思上不同于“人”“咬”“狗”这三个字,也不同于“狗咬人”这个文字全部相同但顺序颠倒的句子。在像语言这样的离散组合系统中,有限的元素可以生成数量无穷、特性无限的组合方式。自然界中另一个重要的离散组合系统是DNA的遗传密码。在DNA中,4种核苷酸组合成为64种密码子(codons),而这64种密码子则可以串联成无限数量的不同基因。许多生物学家都十分看重语法规则和基因组合之间的相似性。以遗传学术语为例,DNA序列中不但包含了“字母”(letters)和“标点”(punctuation),还可能是“回文”(palindromic)、“无义”(meaningless)或者“同义”(synonymous),或被“转录”(transcribed)和“翻译”(translated),甚至可以被储存于“文库”(libraries)中。免疫学家尼尔·耶尼(Niels Jerne)发表的诺贝尔奖获奖演说的题目就是:《免疫系统的生成语法》(The Generative Grammar of the Immune System)。

与之相对的是,我们在世界上看到的大多数复杂系统,如地质、调色、烹饪、声、光和气象等,都属于“共混系统”(blending system)。在共混系统中,组合体的特性是各元素特性中和的结果,而各元素则由于均分、混合而丧失了本身的特性。例如,将红色涂料与白色涂料混在一起,将得到粉红色的涂料。因此在共混系统中,组合体所能拥有的特性极其有限,如果要区分共混系统中数目繁多的组合体,就只能对其中的细微差异进行逐层甄别。由此可见,在整个宇宙中,最让我们印象深刻的两大开放式复杂构造——生命和心智都是基于离散组合系统,这或许并非巧合。许多生物学家认为,如果遗传不是以离散的形式出现,我们所谓的“进化”就不可能发生。

因此,语言的工作机制是:每个人的大脑中都包含了一部词典,它囊括了所有词语及其代表的概念,即“心理词典”(mental dictionary),此外还包含了一套遣词造句的规则,以便传达各个概念之间的逻辑关系,即“心理语法”(mental grammar)。我们将在下一章探索词语的世界,而本章的任务是剖析语法的构造。

语法是一套离散组合系统,这一事实产生了两个重要后果。第一个即是语句的浩瀚无穷。如果你走进美国国会图书馆,随便从一本书中挑出一个句子,那么你很可能无法再找到一个和它一模一样的句子,无论你在书海中翻腾多久。一个普通人能造出多少个句子?答案几乎是无法想象的。如果随机打断某个人的一句话,那么在被打断的地方,我们平均可以插入10个不同的词来续接这个句子,而没有语法或意义上的毛病(在句子的某些部位,我们只能插入一个词,而在其他一些部位,我们则有上千种选择,因此以10为平均数)。再假设句子的长度为20个词,那么从理论上说,一个人可以制造出至少1020个句子(也就是1后面加上20个0)。假设以每个句子被说出的时间为5秒来计算,即便一个人不吃不睡,也要花费100万亿年的时间来记住所有这些句子。而且,20个词的长度限制也显得过于苛刻。下面这个句子出自萧伯纳之手,长达110个词:

Stranger still, though Jacques-Dalcroze, like all these great teachers, is the completest of tyrants, knowing what is right and that he must and will have the lesson just so or else break his heart(not somebody else’s, observe), yet his school is so fascinating that every woman who sees it exclaims: “Oh why was I not taught like this!” and elderly gentlemen excitedly enroll themselves as students and distract classes of infants by their desperate endeavours to beat two in a bar with one hand and three with the other, and start off on earnest walks around the room, taking two steps backward whenever M. Dalcroze calls out “Hop!”

更为奇怪的是,尽管雅克-达克罗兹和所有那些伟大的教师一样,是一个彻头彻尾的专制者,但他知道什么是正确的教法,一定要这样上课,否则就会伤透心——注意,伤的可不是别人的心。然而,他的学校却具有无比的吸引力,每一个见过的女人都会说:“哎呀,为什么没有老师这样教过我呢?”而一些老大不小的绅士们则兴致勃勃地报名参加他的舞蹈班,他们竭尽全力地一手打着二拍、一手打着三拍,并认认真真地在教室里绕圈,当达克罗兹喊“跳”的时候,就立刻后退两步。他们的表现不免让班里的孩子们分心侧目。

的确,如果把70年的平均寿命撇在一边,我们每个人都能说出无限多的句子,这就像数学上存在无限多的整数一样。当你认为自己找到了最大的整数之后,只要加上个1,一个新的整数又出现了,所以句子的数量也一定是无限的。根据《吉尼斯世界纪录大全》(The Guinness Book of World Records)的记录,世界上最长的英文句子出自威廉·福克纳(William Faulkner)的小说《押沙龙,押沙龙!》(Absalom, Absalom!),该句长达1 300字。它的开头是:

They both bore it as though in deliberate flagellant exaltation ...

他俩都心甘情愿地承受它,如同宗教上的苦修……

然而,我完全可以用下面这个句子来打破这个纪录,为自己赚得不朽的名声:

Faulkner wrote, “They both bore it as though in deliberate flagellant exaltation ...”

福克纳写道:“他俩都心甘情愿地承受它,如同宗教上的苦修……”

但这个名声很快就会化为过眼云烟,因为别人可以用下面这个句子打败我:

Pinker wrote that Faulkner wrote, “They both bore it as though in deliberate flagellant exaltation ...”

平克写道,福克纳写道:“他俩都心甘情愿地承受它,如同宗教上的苦修……”

当然,这个纪录也会旋即被人打破:

Who cares that Pinker wrote that Faulkner wrote, “They both bore it as though in deliberate flagellant exaltation …” ?

谁在乎平克写道福克纳写道“他俩都心甘情愿地承受它,如同宗教上的苦修……”?

以此类推,这种“句子接力”可以永远继续下去。“有限域的无限应用”是人类大脑的一个特性,能使之区别于日常生活中的所有人工语言设备,比如会说话的玩具娃娃、能够提醒你关上车门的汽车以及声音甜美的电子语音信箱(“更多选择请按#号键”),它们依靠的都是固定列表中的预设语句。

语法构造的第二个后果是,它是一个独立自主、与认知无涉的代码。语法只告诉我们应该如何组合文字来表达意义,而这些规则与人们相互之间传达的具体意义无关。因此,我们常常会有这种体会:虽然一些句子并不符合英语的语法规则,但我们却可以从常识上理解它们。下面就是一些例句,虽然它们在语法上有问题,但意思却非常好懂:

Welcome to Chinese Restaurant. Please try your Nice Chinese Food with Chopsticks: the traditional and typical of Chinese glorious history and cultual.

欢迎来到中国餐馆。请用筷子品尝美味的中国菜肴:它代表了中国的辉煌历史和传统文化。

It’s a flying finches, they are.

它是一群飞雀。

The child seems sleeping.

这孩子好像睡着了。

Is raining.

正在下雨。

Sally poured the glass with water.

莎莉倒了一杯水。

Who did a book about impress you?

这本让你印象深刻的书是谁写的?

Skid crash hospital.

车辆打滑撞进了医院。

Drum vapor worker cigarette flick boom.

锅炉工人扔掷的烟头引发了爆炸。

This sentence no verb.

这个句子没有动词。

This sentence has contains two verbs.

这个句子包含两个动词。

This sentence has cabbage six words.

这句话删掉了6个字。

This is not a complete. This either.

这个不完整,那个也是。

这些句子都“不合语法”,但它们的问题与课堂上教授的分裂不定式(split infinitives)、悬垂分词(dangling participles)等语法错误无关,而是表现为这样一种现象:尽管这些句子的意思很好理解,但每个说英语的人都能下意识地判断出它们存在这样或那样的毛病。因此,所谓的“不合语法”,只不过是相对于我们头脑中用来翻译句子的固定代码而言的。面对一些语法不通的句子,我们有时会猜测它们的意思,但却不敢肯定我们的理解就符合说话者的本意。在这个问题上,计算机表现得更加苛刻,一旦碰到不合语法的句子,它就回答:“SYNTAX ERROR”(句法错误),以表示自己的不满,例如:

> PRINT(x + 1

*****SYNTAX ERROR*****

反之亦然,一些句子虽然毫无意义、不知所云,但却符合语法标准。乔姆斯基曾经杜撰过一个经典的句子,这也是他唯一一句入选《巴特利特引语词典》(Bartlett’s Familiar Quotations)的名言:

Colorless green ideas sleep furiously.

无颜的绿色念头狂怒地睡着。

这个特意杜撰的句子表明,语法和语义是相互独立的。不过,在乔姆斯基之前,已经有许多人意识到了这一点。流行于19世纪的“谐趣诗文”(nonsense verse and prose)就是以此为创作技巧的。下面是著名谐趣大师爱德华·李尔(Edward Lear)的两句诗:

It’s a fact the whole world knows,

That Pobbles are happier without their toes.

全世界都知道这回事,

没有脚趾头的泡泡更快乐。

马克·吐温也曾戏谑地模仿过一些作家笔下过于浪漫的景色描写,以讽刺那些文字的华而不实:

It was a crisp and spicy morning in early October. The lilacs and laburnums, lit with the glory-fires of autumn, hung burning and flashing in the upper air, a fairy bridge provided by kind Nature for the wingless wild things that have their homes in the tree-tops and would visit together; the larch and the pomegranate flung their purple and yellow flames in brilliant broad splashes along the slanting sweep of the woodland; the sensuous fragrance of innumerable deciduous flowers rose upon the swooning atmosphere; far in the empty sky a solitary esophagus slept upon motionless wing; everywhere brooded stillness, serenity, and the peace of God.

这是10月上旬一个清新宜人的早晨。丁香花和金链花沐浴着秋日的艳阳,灼灼其华,在半空中显露出它们鲜丽夺目的容颜,这是慷慨的大自然为那些没有翅膀的野生生灵架起的一座仙桥。这些生灵在树梢结巢,常在那里聚首。顺着一望无际、布满蓁莽的斜坡,落叶松和石榴树像燃烧着的紫色和蓝色的烈焰;落英缤纷,升腾起醉人的芳香,让人目眩神迷。在虚空深处,一根孤寂的食管安睡在静止的一侧;主宰四野的是沉寂、宁静与和平之神。

而且,几乎所有人都见识过刘易斯·卡罗尔(Lewis Carroll)在《爱丽丝镜中奇遇记》(Through the Looking-Glass and What Alice Found There)中写的《蛟龙杰伯沃基就诛记》:

And, as in uffish thought he stood,

The Jabberwock, with eyes of flame,

Came whiffling through the tulgey wood,

And burbled as it came!

One, two! One, two! And through and through

The vorpal blade went snicker-snack!

He left it dead, and with its head

He went galumphing back.

“And hast thou slain the Jabberwock?

Come to my arms, my beamish boy!

O frabjous day! Callooh! Callay!”

He chortled in his joy.

’Twas brillig, and the slithy toves

Did gyre and gimble in the wabe:

All mimsy were the borogoves,

And the mome raths outgrabe.

沉湎于冥思兮蚊龙乃出,

彼名杰伯沃基兮其目喷焰。

狂飙起兮彼出于丛林,

凛凛然兮天地为之抖颤。

挥刀而斩兮殊死之斗,

利刃闪闪兮直贯其首。

弃其尸于野兮凯歌高奏,

勇士归兮手提其头。

投身于吾怀兮勇哉吾子,

杰伯沃基乃汝所诛。

荣哉此时兮万岁!万岁!

彼拥其子而欢呼。

风怒兮阴霾满空,

滚滚兮布于西方。

雾霭范卓兮翻腾,

怒号兮直达上苍。

正如主人公爱丽丝所说:“它使我头脑里充满了各种各样的想法,只不过我说不清楚到底是怎么回事罢了。”虽然各种常识或知识背景都无法帮助我们理解这些诗句,但说英语的人都看得出,这些句子完全符合英语语法。凭借心里的语法规则,他们能够从中提炼出虽然抽象、但却八九不离十的大意。例如爱丽丝推测说:“不管怎么说,反正是什么人杀了什么东西。这一点我敢肯定。”在看过《巴特利特引语词典》中的乔姆斯基语录后,每个人都可以回答如下一系列问题:“什么东西在睡觉?它是怎么睡的?是一个东西在睡还是几个东西在睡?这些想法是什么样的?”

如何通过语法组合文字

潜藏于人类语言之下的语法到底是如何组合文字的?迈克尔·弗莱恩(Michael Frayn)在他的小说《罐头人》(The Tin Men)中提供了一种最简单的解释:按序排列。小说的主人公是某个自动化研究所的工程师,他必须设计出一个能够生成各种类似新闻故事的计算机系统,例如像“瘫痪女孩决心重返舞台”这样的励志报道。以下是他手工测试程序的情景,这个程序专门用来构造各种以皇室仪式为背景的故事:

他打开档案柜,从中挑出第一张卡片。上面显示“Traditionally”(传统地)一词。接下来就是在“coronations”(加冕)、“engagements”(约会)、“funerals”(葬礼)、“weddings”(婚礼)、“comings of age”(成年)、“births”(出生)、“deaths”(死亡)、“churching of women”(安产感谢礼)等卡片中随机抽取一张。昨天他选择的是“funerals”,随之被准确地引导到一张内容为“occasions for mourning”(哀悼的场合)的卡片上,今天他闭上眼睛,抽到了“weddings”,并被引导到一张内容为“occasions for rejoicing”(欢庆的场合)的卡片上。

接下来的逻辑选择是“The wedding of X and Y”(X与Y的婚礼),然后他面临两个选择:一个是“is no exception”(没有特别之处),一个是“is a case in point”(是一次特别的婚礼),而无论选择哪一个,后面都可以接“indeed”(事实上)。的确,无论以哪一种场合开头,比如加冕、死亡或者出生,戈德瓦塞尔(Goldwasser)都能以计算的方式轻松应对,但现在他也遇到了同样的瓶颈。他在“indeed”上停顿了下来,然后紧接着抽出了一张卡片,内容是:“it is a particularly happy occasion, rarely, and can there have been a more popular young couple”(这是一次特别欢乐的场面,真是难得一见,没有比他们更受大家喜爱的一对新人了)。

在接下来的选择中,戈德瓦塞尔抽到的是“X has won himself/herself a special place in the nation’s affections”(X已赢得了全国的民心),这使得他(或她)再接再厉,而“英国人民也已经从心里接纳了Y” 。

戈德瓦塞尔惊讶地发现, “fitting”(合适)一词还没有出现,这让他感到有些不安。但紧接着他就抽到了这张卡片:“it is especially fitting that”(特别合适的是)。

这个结果将他引导到“the bride/bridegroom should be”(新娘或新郎应该)这张卡片上。接下来他有大量的卡片可选:“of such a noble and illustrious line”(出自如此的名门望族)、“a commoner in these democratic times”(生于民主时代的平民家庭)、“from a nation with which this country has long enjoyed a particularly close and cordial relationship”(来自与本国长期保持着深厚友谊的国家)、“from a nation with which this country’s relations have not in the past been always happy”(来自一个与本国存在历史摩擦的国家)。

戈德瓦塞尔觉得,在上一次编造故事时,“fitting”一词的表现相当不错,因此他特意再次挑选了它,卡片的内容是“It is also fitting that”(也很合适的是)。紧接着出现的是“we should remember”(我们应该记住的是)和“X and Y are not merely symbols—they are a lively young man and a very lovely young woman”(X和Y不仅仅是两个符号——他们还是一对充满朝气、活泼可爱的年轻人)。

戈德瓦塞尔闭上眼睛,抽了下一张卡片,内容是“in these days when”(在……的日子里)。他沉思了一下,考虑是应该选“it is fashionable to scoff at the traditional morality of marriage and family life”(对传统的婚姻和家庭观念的嘲弄蔚然成风),还是选“it is no longer fashionable to scoff at the traditional morality of marriage and family life”(对传统的婚姻和家庭观念的嘲弄已经不再时髦)。戈德瓦塞尔决定选择后者,因为它的结构更加华丽繁复。

这台设备的学名叫“有限状态机”(finite-state)或“马尔可夫模型”(Markov model),不过我们姑且把它称为“字串机”(word-chain device)。这台机器拥有一大批词语列表(或者预设短语),以及一套在各个列表之间进行对应、筛选的操作规则。它的处理器会先在某个列表中选择一个单词,然后在另一个列表中再选择一个单词,依次类推,最终制造出一个句子。如果要理解他人说出的句子,这台机器只能以列表为参照,依次核对句中的每个单词。像弗莱恩这样的讽刺作家经常拿字串系统开涮,把它视为一种可以自动生产赘语冗辞的工具,例如有一种所谓的“社会科学术语生成器”(Social Science Jargon Generator),读者只需依次从以下三栏中各选出一个词,便可组成像归纳性聚合式相互依赖“inductive aggregating interdependence”这样听起来冠冕堂皇的术语。

最近我见过一台字串机,它可以自动生成书封上的宣传广告,另外还有一台字串机能够替代鲍勃·迪伦(Bob Dylan)编写歌词。

字串机是最为简单的一种离散组合系统,它可以从一组有限的元素中创建出无限的特定组合。尽管它的表现略显拙劣,但一台字串机可以生成无限数量的符合语法的英文语句,例如,一些最为简单的句式:“A girl eats ice cream”(一个女孩吃着冰激凌)或“The happy dog eats candy”(这只欢快的狗吃着糖果)。

这种句式包含着无限个句子,因为“happy”上的循环箭头标志着字串机可以任意重复“happy”一词的次数,例如“The happy dog eats ice cream”“The happy happy dog eats ice cream”等,以至于无穷。

当工程师准备建立一套符合特定顺序的字词组合系统时,他首先想到的必然是字串机。电话查询台的语音录音就是一个很好的例子,它事先录下10个数字的读音,并且每个数字的读音又分作7个音调(位于电话号码首位的数字是一个音调,位于第二位的数字又是一个音调,以此类推)。有了这70个录音,它就可以播报出1 000万个电话号码,再加上3位数的区号所产生的30个录音,一共可以组合成上亿个电话号码(不过在实际生活中,由于各项规定的限制,许多号码并不会被用到,比如说0和1不能作为电话号码的第一位数)。事实上,已经有人付出了极大的努力,希望为英语构建出一套巨大的字串模型。为了使它尽可能地符合现实情况,设计者将各个单词之间的转移情况与它们在英语中的衔接概率进行了匹配,例如“that”一词后面紧跟“is”的概率要大于“indicates”。研究人员通过两种方法建立了一个庞大的“跃迁概率”(transition probability)数据库:一是借助计算机对大量英语文献进行分析;二是向参加试验的志愿者播报一个或一系列单词,然后询问他们第一时间联想到的是哪个单词。一些心理学家表示,人类语言其实就是一个储存在大脑中的巨型字串。这个看法与“刺激-反应”理论不谋而合:一个刺激引发一个反应,在这里,反应就是嘴里说出的某个单词,而当说话者察觉到自己的反应时,这个反应又转变为新的刺激,引发他做出下一个反应,即说出后面的单词。

但事实上,正如弗莱恩在小说中描写的那样,字串机的工作原理是那么的拙劣可笑,这不能不引起我们的怀疑。如果将我们的语言机制看成一台字串机,那就等于说我们的大脑是如此的盲目无知、缺乏创意,以至于一台简单的机器就可以制造出无穷无尽且足以以假乱真的例句。而弗莱恩的小说之所以显得异常幽默,正是因为我们的语言机制与字串机并非一回事。所有人都相信,人类(包括社会学家和记者在内)并不是真正意义上的字串机,二者之间只不过是有几分相似而已。

然而,乔姆斯基认为,字串机理论不仅仅是一个值得怀疑的看法,在人类语言机制的问题上,它其实犯了一个根本性的错误。由此,乔姆斯基拉开了现代语法研究的序幕。在他看来,虽然字串机也属于离散组合系统,但它与语言机制有着根本区别。以下是它存在的三个问题,而这三个问题也恰好反映了语言机制的三个特性。

首先,一个英文句子与一串根据跃迁概率连接起来的英文单词截然不同,例如乔姆斯基的句子“Colorless green ideas sleep furiously”。乔姆斯基杜撰这个句子的目的,不仅是为了表示毫无意义的句子也可以符合语法,他同时还想说明,那些概率极小的字序连接也可以符合语法。在英语文本中,单词“colorless”之后紧跟“green”的概率显然为零。“green”之后紧跟“ideas”的概率也为零,再如“ideas”之后紧跟“sleep”,“sleep”之后紧跟“furiously”等,莫不如此。尽管如此,这一串文字仍然算得上是一个语法精当的英语句子。相反,如果一个人真的只根据跃迁概率来串联字词,他得出的字串恐怕会毫无语法可言。例如,假设你采用的方法是根据前4个单词来推测下一个最可能出现的单词,由此逐字逐词地生成一个字串,其中每个单词的出现都取决于它前面的4个单词,其 结果是:你将看到一堆莫名其妙的英语单词,而非一个英文句子。例如:“House to ask for is to earn our living by working towards a goal for his team in old New-York was a wonderful place wasn’t it even pleasant to talk about and laugh hard when he tells lies he should not tell me the reason why you are is evident.”

英文语句与英语字串的区别让我们明白了两个道理。第一,在学习语言的时候,人们学习的是如何将字词合理地排列,而不是机械地记住其前后顺序。人们是通过词性(如名词、动词等)的搭配原则来实现这一点的。换言之,我们之所以可以辨认出“colorless green ideas”这个短语,是因为它在形容词和名词的搭配上与“strapless black dresses”(无肩带的黑色裙子)这样的常见短语完全一致。第二,名词、动词和形容词的搭配并不是以首位相接的形式连成一串的,在句子的构建过程中,存在着一个整体蓝图或者框架,为每个单词设定了具体的安放位置。

如果字串机拥有足够的智慧,它或许可以解决这些问题。但乔姆斯基已经明确地驳斥了将人类语言视为字串的观点。他证明说,即使从理论上说,某些英语句型也无法由字串机来完成,无论这台字串机的功能有多强大,也无论它是否完全以概率表为准则。例如下面这两个句子:

Either the girl eats ice cream, or the girl eats candy.

这个女孩要么吃冰激凌,要么吃糖果。

If the girl eats ice cream, then the boy eats hot dogs.

如果这个女孩吃冰激凌,这个男孩就吃热狗。

乍看之下,这两个句子似乎很容易分解:

但字串机对此束手无策。在一个句子中,“Either”之后必须连接以“or”引起的分句,没有人会说“Either the girl eats ice cream, then the girl eats candy”。同样,“if”之后跟随的是“then”,没有人说“If the girl eats ice cream, or the girl likes candy”。但是,要满足句中早先出现的单词与稍后出现的单词之间的对应关系,字串机必须在逐字炮制句子的同时记住早先出现过的单词。而这就是问题所在:字串机是一个“健忘者”,它只能记住自己刚刚选取的单词列表,而无法记住之前的内容。当字串机运行到“or”或者“then”列表时,它根本记不清句子的开头到底是“if”还是“either”。当然,我们可以从制高点的位置居高临下地鸟瞰整个“路线图”,记住这台字串机在第一个岔口上所选择的道路;但对于在列表之间匍匐前进的字串机而言,要记住自己之前走过的道路却是不可能的事情。

或许你认为这只是一个很简单的问题,我们只须对字串机进行重新设计,让它可以记住自己先前选择的内容,例如,这台字串机能够将单词“either”和“or”以及它们中间可能出现的字序组合成一个大序列,再将“then”和“if”以及它们中间的字序组合成另一个大序列,然后再进行第三个序列的生成。例如:

然而,这一解决方案存在非常明显的问题:它产生出三个相同的“子网”(subnetwork)。显然在现实语境中,无论人们在“either”和“or”之间插入什么内容,它们都同样可以插入“if”和“then”之间,也可以插入“or”或“then”之后。但是,人类的这种能力乃是出自大脑语言机制的自然设计,而并非依赖于某位设计者精心编写的三组相同的指令集(或者貌似更加合理的是,儿童在学习该句的句式时必须分三次进行,先是“if”和“then”之间的序列,然后是“either”和“or”之间的序列,最后是“then”和“or”之后的序列)。

不过,乔姆斯基对这个问题看得更深。他表示,以上两个句子都可以嵌入其他任何句子之中,甚至包括它们自己在内:

If either the girl eats ice cream or the girl eats candy, then the boy eats hot dogs.

如果这个女孩要么吃冰激凌要么吃糖果的话,那么这个男孩就吃热狗。

Either if the girl eats ice cream then the boy eats ice cream, or if the girl eats ice cream then the boy eats candy.

如果这个女孩吃冰激凌,那么这个男孩要么吃冰激凌,要么吃糖果。

就第一个句子而言,字串机必须分别记住“if”和“either”,然后才能在稍后的过程中依次选择“or”和“then”。就第二个句子而言,它必须分别记住“either”和“if”,然后才能选择“then”和“or”来完成句子。从理论上说,位于句子开头部分的“if”和“either”的数量可以无限多,而每个“if”或“either”都需要一个“then”或“or”来完成句子。因此,分别列出每一个可供记忆的字串序列其实并没有多大意义,你必须为此记住无限个字串,而这显然超出了我们大脑的容量。

这种学术性的论证可能会让你颇感诧异。在现实生活中,没人会说出以“Either either if either if if”开头的句子,因此谁又会在乎这台语言机制的模拟装置是否能用“then…then…or…then…or…or”来完成句子呢?不过,乔姆斯基只是借用了数学家的研究方法,他将“either-or”与“if-then”的交替现象视为一种最简单的语言特性,即前后单词的“长距离依存关系”(long-distance dependencies),以便从数学上证明字串机无法处理这些依存关系。

事实上,这种依存关系在语言中比比皆是。人们时时刻刻都在用它,不但距离超长,而且经常一次数个,但字串机却做不到这一点。例如,语法学家常常用这个以5个介词结尾的句子为例:Daddy trudges upstairs to Junior’s bedroom to read him a bedtime story. Junior spots the book, scowls, and asks, “Daddy, what did you bring that book that I don’t want to be read to out of up for?”(父亲步履蹒跚地爬上楼,来到孩子的卧室,只为给孩子读一个睡前故事,孩子看见书,皱着眉头问道:“爸爸,你怎么把这本我不想听的书带上来了呢?”)这个孩子在说到“read”一词时,已经在脑海中形成了4个依存关系:“read”与“to”、“that book that”与“out of”、“bring”与“up”、“what”与“for”。不过,下面这个源于现实生活的例子或许更能说明问题,它出自某位读者写给《电视指南》(TV Guide)的一封信:

How Ann Salisbury can claim that Pam Dawber’s anger at not receiving her fair share of acclaim for Mork and Mindy’s success derives from a fragile ego escapes me.

安·索尔兹伯里说,帕姆·道伯之所以没有因《默克与明蒂》的成功获得应有赞誉而生气,是源于她脆弱的自我。我不明白她为什么这样说。

显然,这位写信者在写到“not”时,脑海中一定形成了4个需要完成的语法结构:(1)“not”之后需要接动词的“-ing”形式(“her anger at not receiving acclaim”);(2)“at”之后需要接名词或动名词(“her anger at not receiving acclaim”);(3)单数主语“Pam Dawber’s anger”规定了它的动词(即其后第14个单词)也必须保持单数形式(Dawber’s anger…derives from);(4)以“How”开头的单数规定了它的动词(即其后第27个单词)也必须保持单数形式(How …escapes me)。同样,读者在理解这个句子时,也需要将这些依存关系牢记于心。从技术上讲,我们可以制造出一个能够处理这些句子的字串机,只要说话者需要记住的依存关系在数量上有具体的限度(比如说4个)。但是,这台机器的冗余度将大得不可思议,因为面对每一种依存组合,这台机器都必须对同一个字串进行重复复制,而这种依存组合的数量多达千计。即使耗尽我们的大脑,也无法记住这样的超级字串。

《语言本能:探索人类语言进化的奥秘》