人类大脑是否与计算机不同

对这个问题的回答依赖于我们所说的“计算机”是指什么东西。今天大多数的计算机都是数字的,并且每次都以极高的速度执行一条(或几条)指令集。而人类的大脑结合使用数字和模拟的方法,它会在模拟(连续)区域通过使用神经递质和相关机制来执行大部分的计算。虽然这些神经元以极其缓慢的速度(通常是每秒200次)执行计算,但是大脑整体上是大规模并行的:大多数的神经元都在同一时间工作,这使得多达100万亿次计算同步进行。

人类大脑的大规模并行机制是其模式识别能力的关键,而模式识别正是人类思维的支柱之一。哺乳动物的神经元显得有些混乱(有许多明显随机的相互作用),如果神经网络已经训练得很好,那么一个反映网络决策的稳定格局就会出现。当前,计算机的并行设计还比较有限。但并没有理由说明与生物神经网络功能相当的非生物再创造无法使用这些原则。的确,全世界数十次的努力已经成功地完成了这些事。我的技术领域就是模式识别,而且我在四十年里所涉及的工程项目中也一直使用这种可训练性且具有不确定性的计算方式。

通过利用有足够能力的通用计算,很多大脑特有的组织方法可以有效地模拟出来。我相信复制自然的设计范式将成为未来计算的主要趋势。我们也应该牢记,数字计算可以与模拟计算功能等效,也就是说,我们可以用全数字计算机执行一个数字模拟网络所有的功能。而反过来是不正确的:我们不能用一个模拟计算机来模拟一个数字计算机的所有功能。

然而,模拟计算的确有一个工程上的优势:它的潜在效率是现在的数千倍。模拟计算可以在几个晶体管中或在哺乳动物神经细胞里,以及特殊的电化学过程中执行。相反的是,数字计算则需要成千上万个晶体管。另一方面,这种优势将被基于计算的数字仿真所抵消,因为数字计算机可以轻易地进行设计(和修改)。

大脑区别于传统计算机的关键方式还有很多:

●大脑的电路非常缓慢。突触复位和神经元稳定的时间(在神经元放电后,神经元及其突触的重置时间)如此漫长,以致几乎没有神经元放电周期可以进行模式识别。功能性磁共振成像(fMRI)和脑磁图描记术(MEG)扫描显示,不需要解决语义含糊的判断似乎是在单个神经元放电周期(小于20毫秒)内制造的,而且基本上没有涉及迭代(重复)进程。物体识别需要约150毫秒,以致即使我们“在思考有些事”,但是运作周期数最多也只是以数百或数千衡量,而不是像是一台标准的计算机那样,以数十亿计算。

●但它是大规模并行的。大脑相当于100万亿神经元间的相互连接,它们都可能在同时处理信息。正如我们前面讨论过的,这两个因素(较长的周期和大规模并行)引起了一定程度的大脑计算能力。

今天,我们最大的超级计算机正在接近这个范围。最先进的超级计算机(包括那些用于最流行的搜索引擎的计算机)超过了1014cps准则,这与我在第3章讨论功能仿真的估计相匹配。不过,没有必要采用和大脑相同的并行化处理的粒度,而只要我们配合整体的运算速度和存储容量的需要就可以,否则就需要模拟大脑的大规模并行结构。

●大脑模拟和数字相结合的现象。大脑连接的拓扑结构本质上是数字的——无论连接存在还是不存在。而轴突放电则不全是数字的,但接近于一个数字的过程。大脑中几乎大部分的功能都是模拟的,充满着非线性(在产出方面的突然变化,而不是平稳变化),非线性实质上比我们已经在神经元中利用的经典模型还要复杂。然而,详细的非线性神经元动力学和神经元的组成(树突、棘、通道和轴突)可以通过非线性系统的数学来模拟。这些数学模型能够在数字电脑上模拟到任何所需的准确程度。正如我所说的,如果我们使用晶体管以本地模拟的方式来模拟神经区域,而不是通过数字计算,那么这种方法可以使能力提高3个或4个数量级,这一点卡福·密德已经给出证明。13

●大脑自身线路重铺。树突不断扫描新的棘和突触,而树突和突触的拓扑结构和传导性还会不断调整。神经系统在其组织的各个层次上都是自组织的。在计算机化的模式识别系统(例如神经网络与马尔可夫模型)中应用的数学方法比在大脑中所用的简单,而我们在自组织模式上确实有大量的工程经验。14当代计算机不能逐字地重复本身(尽管新出现的“自我修复系统”已经开始这样做),但我们可以有效地模拟这个软件过程。 15在软件中实施自组织会有优势,因为它会为程序员提供更多的灵活性,而在未来我们也可以在硬件中实现这一点。

●大脑中的大部分细节都是随机的。虽然在大脑的每个方面都有许多随机(在严格控制下的随机)过程,我们没有必要模仿每个轴突表面的所有“涟漪”,至多需要在了解了计算机操作原理的情况下模仿每个晶体管表面的所有微小差异。但某些细节对于解码大脑操作的原则是很关键的,这迫使我们必须将它们和那些包含随机“噪音”或混乱细节加以区分。神经功能中混乱(随机和难以预料的)的部分可以通过利用复杂性理论和混沌理论的数学方法进行建模。16

●大脑运用浮现特性。智能行为是大脑混乱和复杂活动的突显特征。对比白蚁和蚂蚁巢穴的智能化设计,考虑它们精心构建的互联隧道和通风系统。尽管这些都是灵巧、复杂的设计,但蚂蚁和白蚁群里却并没有建筑专家。这些建筑都是由所有巢穴成员不可预测的互动建造起来的,每个成员都依照一些相对简单的规则执行。

●大脑是不完善的。这是复杂自适应系统的本性,其决策所表现的智能是次最佳的。(也就是说,相对于其要素的优化配置所表现的智能相比,它反映了较低级别的智能。)它只需要足够好,这对我们人类而言就意味着已经有充足的智力水平,使我们能够骗过在生态中与我们相类似的对手(例如,灵长类动物也结合了相对应的附属品所带来的认知功能,但其大脑没有人类那样发达,它们的手也没有人类的那么适用)。

●我们自我违背。各种各样的思想和方法,包括那些相冲突的,最终造就了卓越的成果。我们的大脑完全能够持矛盾的观点。事实上,我们依靠内部的多样性而蓬勃发展。在这点上可以考虑与人类社会相对比,社会有其解决多种观点的建设性方法。

●大脑运用进化。大脑使用的基本的学习模式是渐进的:理解世界最成功,对认知和决策作出贡献的连接模式会幸存下来。一个新生儿的大脑主要包含随机联系的神经元连接,只有一部分新生儿一生下来就拥有两岁小孩的大脑智力。17

●这些模式很重要。这些混乱的自组织方法的某些细节是至关重要的,它们是以模式约束(确定初始条件规则和自组织方式)的形式显示出来的,而最初在约束中的许多细节都是任意设置的,系统然后进行自组织并逐步表现出已提交给系统的信息的不变特征。所产生的信息在特定的节点或连接中找不到,相反的,这是一个分布式的模式。

●大脑是全息的。全息图中的分散信息和大脑网络中信息的表现形式有类似之处。我们也在用于计算机模式识别的自组织方法(例如:神经网络、马尔可夫模型和遗传算法)中发现了这一点。18

●大脑是密切联系的。大脑从一个深层的连接网络中得到恢复力,在这个网络中的信息从一个点转到另外一点的方式有很多种。拿互联网来作类比,随着其组成节点的数量增加,网络已变得越来越稳定。节点,甚至互联网整个枢纽,可以变得不起作用,而整个网络却不会因此而瘫痪。同样,我们不断丧失神经元,但这并没有影响到整个大脑的完整性。

●大脑的确有一个区域的架构。虽然区域内的连接细节最初是随机约束的,而且这些细节还是自组织的,但是仍然有一个区域架构,它使得几百个有特定连接模式的区域执行特定的功能。

●一个大脑区域的设计比一个神经元的设计还要简单。在更高层次的模拟常常会更简单,而不是更复杂。类比一台计算机,如果我们要模拟一个晶体管,我们需要详细了解半导体物理学原理,而一个真正的晶体管所隐藏的方程是很复杂的。然而,在两个数字相乘的数字电路中,虽然涉及数百个晶体管,但模拟起来却更简单,只涉及少数公式。一个由数十亿个晶体管组成的计算机可以通过其指令集和寄存器描述来模拟,而这些可以由少量的文字和数学变换来描述。

一个操作系统、语言编译器和组译器的软件程序是复杂的,但模拟特定程序——例如,以马尔可夫模型为基础的语音识别系统——却可能用短短几页的方程就能描述。这种描述没有任何地方需要半导体物理学的细节。类似的观察也适用于大脑。一个特定的神经排列用来检测一个特定不变的视觉特征(例如脸),或执行一个作用于听觉信息或计算两个事件时间接近性的带通滤波(限制输入到一个特定的频率范围),这些都可以描述得远比实际物理和化学的关系(控制神经递质和其他突触和树突在各自程序中所涉及的变量)要简单。虽然在推进到下一个更高的水平(模拟大脑)前,这种神经的复杂性都必须仔细研究,但是,一旦理解了大脑的工作原理,其中很大一部分都可以得到简化。

努力去理解我们的想法

不断加快研究步伐

我们对人类大脑的研究步伐正不断加快,现在已不断接近这条曲线的拐点(这是一个呈指数增长的快速发展时期),但在这之前我们曾有过无数次的研究尝试。反思和建立人类思维模型的能力是我们人类特有的一种属性。基于对人类外在行为的简单观察,我们建立了早期的人类思维模型(例如,亚里士多德在2350年前所写的对人类联想能力的分析)。19

在20世纪初期,我们开发了研究人类大脑内部物理活动的工具。一个早期的突破就是对神经细胞电流产出的测量,这是由神经科学的先驱艾德里安在1928年开发的,它表明了在人类大脑内部有电流活动发生。20正如他所写道:我在蟾蜍的视神经上安放了一些电极,准备做一些与视网膜有关的实验。房间几乎是全黑的,链接到扩音器的喇叭里反复传出的一些声音让我感到很困惑,而这些声音表明有大量的神经脉冲活动在进行。直到在比较了这些声音与我在屋子里的活动之后,我才意识到我正处在蟾蜍的视野之内,而这些声音就是对我正在做的事情的一种反应信号。

艾德里安从这个实验中得到的重要观点仍然是今天神经科学的基石,感觉神经脉冲的频率与可以被测量的感觉强度成正比,例如,光线越强,从视网膜传到大脑的神经脉冲频率(每秒的脉冲)越快。艾德里安的学生,贺拉斯·巴罗由于发现青蛙和兔子的视网膜里有单独的神经元能触发“感知到”具体的形状、方向和速度,从而提出了这一领域延续至今的另一个很重要的观点:神经细胞的“触发功能”。换句话说,感觉包含一系列神经元层次,每一层次的神经元都能感知到更复杂的图像特征。

从1939年开始,我们开始形成神经元工作原理的思想。通过积累(增加)外界的输入,然后在神经元的膜层上产生电导(这种电导在神经元的细胞膜上突然增多用以传递信号),沿着神经元的轴突传导信号(轴突是通过一个突触与其他的神经元相联系)。霍其金和赫胥黎在研究轴突时将其称为“动作电位理论”(电压)21。他们还在1952年就动物的神经轴突的动作电位进行了实际测量。他们选择了墨鱼的神经元,因为它们的大小和可解剖性很合适这个实验。

在1943年,迈克路和匹兹在霍其金和赫胥黎观点的基础上建立了一个神经网络的简化模型,此举激发了半个世纪对于人造(模拟的)神经网络(使用计算机程序来模拟神经元在大脑中的工作网络)的研究。霍其金和赫胥黎于1952年进一步完善了该模型。尽管我们现在认识到真正的神经元要比最初的这些模型复杂得多,但这些早期概念却得到了认可。对每个神经元突触来说,这一基本神经网络模型都有一个神经的“重量”(代表连接的力量),而对神经元细胞体来说,这一基本的神经网络模型就是一个非线性的发射阈值。

随着神经元细胞体接收的外界输入总和的增加,在达到临界值之前基本上是没有神经元会做出反应的,因为在此时,神经细胞会迅速增加其轴突和放电。不同的神经元有不同的临界值。虽然最近的研究表明神经元的真实反应要比这更复杂,但迈克洛-匹兹和霍其金-赫胥黎的模型仍然是有效的。22

这些观点引领了人工神经网络的大量早期工作,使这个领域为众人所知。这也许是第一个计算机领域自组织的典范。

自组织系统的一个关键要求就是非线性:一些创造的产出不是通过简单地投入总和得到的。早期的神经网络模型在神经细胞的副本中是非线性的。23(基本神经网络的方法是直接的。)24而艾伦·图灵大约在同一时间提出的理论模型同样表明了计算需要非线性。简单创建投入总和的系统并不能符合计算的基本要求。

我们现在知道,实际的生物神经元有很多其他的非线性元素,这些都产生于突触的电化学行为及树突的形态(形状)。对生物神经元的不同安排,可以转化为各种计算,包括减法(扣除)、乘法(增值)、求平均值、筛选、规格化和信号阈值转换,以及其他类型的转换。

神经细胞的增殖能力是非常重要的,因为它要根据另一个网络的计算结果对一个神经元在大脑中的网络进行调节(或受到另一网络计算结果的影响)。在猴子身上进行电生理测量的实验所提供的证据表明,其视觉皮层的神经元在处理图像时,传递信号速率的增减决定于猴子是否正在注意图像的某一区域,25人类FMRI研究也表明,将注意力集中在某一特定的区域增加了大脑皮层中被称为V5区域(这块区域是负责运动检测的)的神经元的反应。 26

1969年,随着麻省理工学院马文·明斯基和西摩·派珀特所写的《Perceptrons》的出版,联结主义运动遭受了挫折。27这本书中包括一个关键定理的证明,当时最常(简单)使用的神经网络类型(称为感知器,率先由康奈尔大学的弗兰克·罗森布拉特证明),并不能解决一条线是否是完全连接这种简单的问题28。使用称为“反向传播”方法的神经网络运动已经在20世纪80年代开始复苏,其中,每一个模拟突触的强度由一种学习的算法来决定,该算法将适应这个重量(在人工神经元每次实验后输出的强度),从而使网络可以“学习”,以便更恰当地匹配正确的答案。

然而,反向传播不是实际的生物神经网络突触重量训练的可行模式,因为实际调节突触连接强度的逆向连接似乎不存在于哺乳动物的大脑中。然而,在计算机体系中,这种类型的自组织系统可以解决广泛的模式识别问题,这种简单自组织模式的互联神经的作用已经得到证明。

但只有很少人知道海勃的第二种学习形式:在一个虚拟的循环中,神经元放电将反馈给自己(可能是通过其他层),从而产生了反射(持续兴奋可能是短期学习的资源)。他还暗示,这个短期的反射可能会导致长期记忆:“让我们假设反射活动(或‘跟踪’)的持续或重复往往会引起持久的细胞变化,这样会增加其稳定性。这样的假设可以作如下精确说明:当一个细胞A的轴突与细胞B靠得足够近时,足以激发细胞B作反复或长期的放电,一些生长过程或新陈代谢变化发生在一个或两个细胞中,这样细胞B的发射源细胞A的效率就会增加。”

虽然海勃反射记忆理论的建立并不像海勃的突触学习那样完善,但最近已发现这种实例。例如,兴奋神经元集(那些刺激突触的集合)和抑制神经元集(阻碍刺激的集合)在某些视觉模式起作用时开始振荡29。麻省理工学院和朗讯科技公司贝尔实验室的研究人员已经创建了一个由晶体管组成的电子集成电路,用来模拟16个兴奋神经元和1个抑制神经元,从而模拟生物的大脑皮质电路。30

神经元和神经信息处理这些早期的模式,虽然过于简化,在某些方面也不准确,但考虑到数据和工具的缺乏,这些理论的发展起到的作用还是很显著的。

《奇点临近》