机器智能:强人工智能

考虑到图灵提出的另一个论点,到目前为止,我们只是构建了相当简单和可预见的人工产品。当我们增加了机器的复杂性,或许我们会为我们的存储感到惊讶。他列举了反应堆分裂的例子,如果低于某一“关键”值,那么什么也不会发生,但是如果高过这个值,就会迅速发生爆发。因此,大脑和机器也可能如此。大多数大脑和所有的机器目前都处于“次临界”状态——他们仅仅以平常的方式回应刺激,而没有自己的思想,只能产生平常的回应。但现在也有一些大脑,或是一些未来的机器正处于超临界状态,它们有自己的思想。图灵表明这只是一个复杂的问题,如果复杂性超过一定的级别,那么将会出现质的区别,因此“超临界”机器与之前的简单机器相比,将是与众不同的。

——卢卡斯,牛津大学哲学家,写于1961年的文章

"Minds,Machines,And Gödel"157

假定超级智能有朝一日在技术上是可行的,人们是否会选择去开发它?这个问题的答案毫无疑问是肯定的。与超级智能紧密联系的是巨大的经济回报,只要是有竞争压力和利润产出,计算机产业在新一代的硬件和软件上的巨额投资将会持续下去。人们需要更好的计算机和更智能的软件,他们希望机器生产的利益能够帮助生产;希望机器可以产生更好的医疗药品;机器可以减轻人类的负担,可以执行无聊或危险的职业;娱乐——产生永恒的消费利润。在这个过程中的任何一个位置,恐惧新技术的人都会振振有词地说:“到此处为止,不要再更进步。”

——尼克·波斯特拉姆,"How Long Before Superintelligence?"1997

超级智能可以解决或者至少可以帮助我们解决任何问题。疾病、贫困、环境破坏,以及各种不必要的痛苦:这些痛苦都是可以通过配备先进纳米技术的超级智能消除的。此外,通过纳米医学,我们不仅可以停止和扭转衰老过程,还能够选择上载我们的智能。超级智能还可以为我们创造机会,极大地提高智力和情感的能力,还可以协助我们创造一个充满吸引力的体验世界,在这个世界中,我们可以快乐地娱乐,快乐地与他人相处,快乐地体验、成长,这便是近乎完美的生活。

——尼克·波斯特拉姆,"Ethical Issues in Advanced Artificial Intelligence,"2003

机器人将继承地球?是的,但是它们将是我们的孩子。

——马文·明斯基,1995

在这三个(遗传学、纳米技术和机器人技术)主要的、根本性的奇点革命中,最深刻的是机器人技术,它所涉及的非生物智能的创造超过了非增强性的人类。较高的智能处理定然会超过低智能处理,它将令智能真正成为更加强大的力量。

在GNR中,R代表机器人技术,这里涉及的真正问题是强人工智能(人工智能超越了人类智能)。在这一构想下,强调机器人技术的原因在于:智能需要一个具体化的物质存在的形式来影响世界。我不赞成强调物质存在,但我相信关注的中心问题是智能。智能必然会以一种方法来影响世界,包括建立承载自己的实体方式和实际操作。此外,我们还可以将身体技能归为智能的基本组成部分。例如人类大脑的一大部分(小脑包含了超过一半的神经元)就用来协调我们的技能和肌肉运动。

有几个原因可以解释为什么人类级别的人工智能一定会大大地超越人类智能。正如我刚才指出的,机器可以很轻易地分享其知识。作为非增强型的人类,我们没有分享大量的神经元连接和神经传递素浓度的大量模式,后者构成了我们的学习、知识和技能,而非缓慢的、基于语言的交流。当然,这种交流方式是非常有益的,因为它使我们与其他动物相分离,并且是科技创造的促进因素。

人的技能只能在变革性的激励下发展。这些技能主要建立在大规模并行的模式识别基础上,提供熟知诸如区分新面孔、确定对象和辨识语言发音这些任务的能力。但它们并不适于很多其他的需求,比如确定财务数据的模式。一旦我们充分掌握了模式识别的范式,机器方法就可以将这些技术应用到任何模式类型。158

机器能够以人类所没有的方式综合利用其资源。虽然与个体相比,人类集体可以实现物质的和精神的伟大事业,但是机器可以轻松而又迅速地集中其计算、存储和通信资源。如前所述,互联网正在演变为一个全球性的计算资源网格,这些资源可以即刻汇集起来,形成大规模的超级计算机。

机器有精确的回忆力。当代计算机可以精确地管理数十亿的资源,而且这种能力每年还在翻番。159计算机根本的速度和性价比每年都在提高,而且增速率本身也在加快。

随着人类知识迁移到网络,机器将能够阅读、理解并合成所有人类的机器信息。而上一次生物人掌握所有的人类科学知识还要追溯到数百年前。

机器智能的另一个优点是,它可以无休止地高速执行任务,并可以整合最尖端的技术。芸芸众生中的一人可能已经掌握了音乐创作,而另一个可能掌握晶体管的设计,但是以固定的人脑结构来说,我们没有能力(或时间)来开发和利用这种日益专业化的领域的最高级别水平的技术。在一些特定的技能上,人们彼此也有很大的区别,以致当我们谈论作曲人的水平时,我们到底是指贝多芬,还是指一般人?非生物智能将达到并超过每个领域的高精尖人才的技能。

基于这些原因,计算机一旦达到人类智能的范围和精妙程度,那么它一定会超越过去并继续以指数级速度上升。

一个关键的奇点问题就在于是先有“鸡”(强人工智能)还是先有“蛋”(纳米技术)。换言之,是强人工智能将导致完整的纳米技术(分子制造装配,可以转化为物质产品的信息),还是完整的纳米技术会导致强人工智能?正如前面内容中提到的原因,第一个前提逻辑是强人工智能将意味着超强的人工智能,而超强人工智能将有能力通过实施完整纳米技术的方法来解决余下的设计问题。

第二个前提是基于实现强人工智能的硬件要求应与基于纳米技术为基础的计算相符合。同样,软件需求将促使纳米机器人对人类大脑机能进行非常详细地扫描,从而完全实现逆向工程人脑。

这两个方面都是合乎逻辑的,很显然两种技术是相辅相成的,现实情况是,这两个领域的进展一定会利用我们最先进的工具,这样在一个领域的进步便将同时促进另一领域的发展。尽管如此,我确实希望出现优于强人工智能的完整分子纳米技术,这个过程只需要几年的时间(2025年左右为纳米技术,2029年左右为强人工智能)。

随着纳米技术革命的到来,强人工智能将有更深远的影响。纳米技术是强大的,但不一定是智能的。我们至少可以设计出管理纳米技术的强大权力的方式,但超级智能却是天生无法控制。

逃逸的人工智能。一旦强人工智能实现,它可以很轻易地获得提高,其能力也会增倍,因为这是机器能力的根本特质。随着强人工智能的到来,很快便会产生许多强人工智能,后者又开始自身的设计、理解和改进自身,从而很快演变成更多的能力,以及更加智能化的人工智能,这个充分过程会无限循环下去。每个周期不仅会创建一个更智能化的人工智能,而且比上一次循环花费更少的周期,这是科技发展(或任何进化过程)的本质。前提是一旦实现强人工智能,它会立即成为迅速增长的超级智能,从而失去控制。160

我个人的看法略有不同,失控的人工智能在逻辑上是有效的,我们需要考虑时机问题。一台机器达到了人类智力的水平并不会马上产生一个失控的现象。这需要考虑到人类的智力水平是有限的。我们现在就有这样的例子——约有60亿个例子。考虑这样一个场景,你从一个购物中心带来由100人组成的一个小组。这个小组由理智的、受过良好教育的人构成。然而,如果这个小组被授予改善人类智慧的任务,进展就不会很大,即使他们也拥有人类智慧的模板。制造一个简单的计算机对他们来说可能也很辛苦。加速他们的思考能力和扩张这100个人的记忆容量也不会立即解决这个问题。

前面的内容已经指出,机器将会匹配(并迅速超越)各个领域顶级的人类技能。因此,我们换成100名科学家和工程师。这是一组在技术上具有良好教育背景的人,他们将有能力改善设计。如果一台机器的能力等效于100(最终1000或100万)个受过技术培训的人的能力,每项操作的速度远远快于自然人,那么一个迅速加快的智能将最终实现。

然而,当计算机通过了图灵测试,这种加速并不会立即发生,图灵测试相当于平均水平的匹配能力,受过教育的人比从商场里面找的人更接近于我们的范例。对计算机来说,管理所有这些必要的技能,并把这些技能与必备的知识基础相匹配是需要时间的。

一旦我们成功地建立了一台机器,并且其能通过图灵测试(大约在2029年),随后将是一个统一的时代,在这个时代里,非生物智能将迅速增长。奇点预期的非凡扩展,人类的智慧数十亿计的翻番,这些将会在21世纪40年代中期发生(就像在第3章讨论的一样)。

人工智能的冬季

有愚蠢的谣言说人工智能已经失败,但人工智能在你周围是无处无时无刻存在的。人们恰恰没有发觉,在汽车系统里调整燃油喷射系统的参数就是人工智能。当你下飞机的时候,人工智能调度系统会为你开门。当你用一个微软软件的时候,都有人工智能系统试图解决你所做的事情,比如写信,它做得相当好。当你看一个由计算机制作角色的电影时,作为一个群体的行为,它们都没有人工智能。当你玩视频游戏时,你的对手就是人工智能系统。

——罗德尼·布鲁克斯,麻省理工学院人工智能实验室主任161

我仍然能碰到有人声称人工智能在20世纪80年代已经枯竭,但这种论点相当于坚持认为互联网将在21世纪初灭亡162。互联网技术表现在带宽和价格方面:节点(服务器)数量,以及电子商务的交易量在度过了低谷和萧条时期后,进入了平稳加速的繁荣期。人工智能也曾经是这样。

范式迁移(从铁路、人工智能、网络、电信到现在可能是纳米技术)中的技术成熟曲线通常开始于不切实际的期望(由于对促进因素缺乏了解而造成的)的时期。虽然这一新的模式利用率成倍增加,但是早期增长缓慢,直到达到指数增长曲线拐点。革命性变革的普遍预期是准确的,它们却是不同步的。当前景并非一帆风顺时,就进入了幻觉期。不过指数增长继续有增无减,多年后一个更加成熟、更切合实际的转变一定会发生。

我们看到19世纪铁路的迅速发展,随后便是普遍的破产(在我收集的历史文件中,发现了有一些早期没有兑付的铁路债券)。我们仍然受到几年前电子商务与电信业萧条的影响,这也导致了燃油经济的衰退,从那时起,我们正走向复苏。

人工智能经历了一个相似的过早并过于乐观的时期,紧随其后的就是1957年由艾伦·纽厄尔,J·C·肖和赫伯特·西蒙创造的通用问题求解程序,这个程序找到了曾经难倒像罗素等数学家的定理的证明,早期的程序都来源于麻省理工学院人工智能实验室,这些程序可以解决大学生级别的学术能力测试问题(比如相似性和经历问题)。163人工智能暴露问题出现在20世纪70年代,20世纪80年代是人工智能的萧条期,那时的人工智能无法转化为利润,那个年代也称为“人工智能的冬季”。许多观察家仍然认为人工智能冬季是这个故事的结束,并且人工智能领域也无法创造任何东西。

然而,今天成千上万人工智能的应用都已经深深植根于每一个工业基础设施中。这些应用大部分是10~15年前的研究项目。那些提问“人工智能到底会带来什么?”的人使我想起了在雨林中的旅客的疑问:“应该住在这里的许多物种去了哪里?”当数百种动植物在一个区域蓬勃繁衍时,它们已经与当地的生态紧密结合在一起了。

我们都顺利地进入了“狭义人工智能”时代,这个概念指的是人工智能正在扮演一个有用而又特定的功能,一旦需要人类智力发挥,人工智能就可以发挥到人的水平或者做得更好。通常狭义的人工智能系统大大超过了人类的智力速度,能够提供管理和考虑成千上万个人同时进行工作。我接下来要描述关于狭义人工智能的例子。

这些时间框架相对于快速发展的互联网和电信的阶段周期(以年来衡量,而不是几十年)来说,人工智能的技术周期(数十年的热情成长,十年的幻灭,十五年在利用上的扎实推进)看上去有些漫长,但有两个因素必须考虑:首先,由于互联网和电信周期相对较近,它们更受范式转型加速的影响(正如在第1章中讨论的一样),因此,最近通过的周期要大大快于40年前开始的周期;其次,人工智能革命将是人类文明要经历的最为深刻的变革,所以它要比那些成熟而又不太复杂的技术经历更长的时间。

理解了现象的技术本质,设计系统集中于该现象,并将它不断放大。例如,科学家发现了曲面的一个微妙的性质(称为波努利原理):气体(例如空气)在曲面上要比在平面上运行快得多。因此,空气压力在曲面上要比在平面上的低。通过了解、聚焦、放大这些奇妙发现的启示,我们在工程中创建了当前所有的飞行技术。一旦我们理解了智能的原理,我们也有相同的机会聚焦、集中并放大其能力。

我们回顾第4章,可以发现理解、建模和模拟人类大脑的每个方面都在加速:包括大脑扫描的性价比和时间与空间分辨率;大脑机能的可用数据与知识的总量;大脑不同区域的模型与模拟的混合度。

我们已经有了一套从人工智能的研究中获取的强有力的工具,这个研究也经过了几十年发展的精炼与完善。大脑逆向工程通过全新包装、生物启示和自我组织等技术可以极大地提高这个工具包。我们最终将能够运用工程能力来集中和放大人工智能,其智能化程度将是以百万亿倍超越现在人类的神经元连接。智能将从属于加速回归定律,该定律说明了现在每年信息技术的能力都在加倍。

人工智能(在这个领域我已经亲身经历了40年)的一个根本性问题是:一旦需要AI技术发挥作用,便会涉及各个领域(例如,字符识别、语音识别、机器视觉、机器人技术、数据挖掘、医疗信息和自动化的投资)。

计算机科学家伊莱恩·理查德将人工智能定义为“研究如何使计算机在什么地方什么时刻使人生活得更好”。罗德尼·布鲁克斯是麻省理工学院人工智能实验室主任,用另外一种方式定义人工智能:“每当我们领会了一种技术,它就会神奇地终止,我们会说,哦,这只是个计算。”我还想起了沃森对福尔摩斯的评论:“起初我以为你做了一些聪明的事情,但事实上那根本算不了什么。”164这是我们作为人工智能科学家一贯的经验。智能魅力看上去减少到“无”时,我们就可以完全理解它的方法了。剩余的就是谜,是有待于激起兴趣的部分,是还没到智能方法理解的部分。

人工智能工具包

人工智能就是在多项式时间内,通过探索问题域知识来解决非常困难问题的技术研究。

——伊莱恩·理查德

正如我在第4章所提到的,这仅仅是我们最近能够获得的关于人类大脑区域功能如何影响人工智能设计的详细模型。在此之前,在缺乏足以了解大脑的工具的情况下,人工智能科学家和工程师开发了自己的技术。正如航空科学家没有模拟鸟儿的飞行能力,早期的人工智能并不熟悉基于反向设计自然智能的方法。

接下来介绍这些方法中的一个小样例。自采用以来,它们就在争议中成长,这使得实用产品的创造可以避免早期系统的脆弱性和高错率。

专家系统。20世纪70年代,人工智能经常等同于一种特定的方式:专家系统。这涉及应用具体逻辑规则的发展来模拟人类专家的决策过程。该过程的一个重要组成部分需要知识工程师与领域专家合作,比如医生与工程师合作编撰其决策规则。

这个领域在早期取得了一些成绩,比如医疗诊断系统,至少对于某些测试来说,可以与内科医生相媲美的。例如,20世纪70年代开发的一个称为MYCIN的系统,就是用来为传染病诊断和提供治疗的。1979年,一个专家评估组比较了由MYCIN和人类医师提供的诊断与治疗,发现MYCIN和医生做的一样好,甚至比任何医生做的还要好。165

很显然,这项人类决策研究往往不是基于明确的逻辑规则,而是基于“更软”的证据类型。医学成像检查出来的黑斑有可能是癌症,但是其他因素诸如它的确切形状、位置、与周围的对比差别,这些可能会影响诊断。人类决策的预感通常受很多先前经历的多种证据综合的影响,而并不是局限于自身。我们甚至常常不自觉地意识到我们使用的许多规则。

到20世纪80年代后期,专家系统正在结合一些不确定性的概念,并且综合许多随机性的根据进行决策。MYCIN系统开创了这种做法。一个典型的MYCIN“规则”内容如下:

如果需要治疗的疾病是脑膜炎,并且是真菌感染类型,那么在染色体上无法看到微生物,病人的身体并不脆弱,病人一直呆在一个地方,却水土不服造成球孢子菌病,病人的种族是黑人、亚裔或印第安人,脑脊液测试中的隐球菌抗原不呈阳性,那么就有50%的可能性,隐球菌不是其中引起感染的生物体。

尽管像这样单一的概率性规则不足以得到一个有效的结论,但是通过汇集数以千计的这样的规则证明可以获得一个可靠的结论。

CYC可能是持续时间最长的专家系统项目,由道格·莱纳特和他的同事在Cycorp公司创建。从1984年开始实施,“赛克”系统已经往数据库里装载了许多具有常识性的知识,它能对从未直接学过的东西进行推演。这个项目涉及从困难编码逻辑规则到概率性规则,现在又包括从书面材料里面提取知识的手段(在人类监督的前提下)。最初的目标是产生一百万条规则,这反映了只是人类了解世界的一小部分。莱纳特最新的目标是让CYC掌握“上亿的规则,截止到2007年,这是一个人能够了解世界规则的大约数目”。 166

另一个雄心勃勃的专家系统正在由日本筑波大学生物科学副教授达里尔梅瑟进行着。他计划开发一个包含所有人类思想的系统。167该应用程序可以用来通知决策者在哪个社区使用哪些思想。

贝叶斯网。在过去的10年里一种称作贝叶斯逻辑的技术建立了强大的数学基础,该技术可以组合上千甚至上百万的所谓“信息网络”或贝叶斯网络的概率规则。该技术最初是由英国数学家托马斯·贝叶斯所设计并在其1763年去世后发表,该方法旨在确定未来事件可能是基于过去发生的同类事件168。许多专家系统就是基于贝叶斯技术不断地从经验中汇集数据,从而持续学习并改进他们的决策。

最有前景的一类垃圾邮件过滤技术就是基于该方法的。我个人使用一个名为Spam-Bayes的垃圾邮件过滤器,它可以帮你把电子邮件分辨出“垃圾”还是“正常”169。你给每个过滤器提供一个文件夹。它就根据这两个文件类型,自动训练自己的贝叶斯信息网络来分析各自的模式,从而使它能够自动将随后的电子邮件放到正确目录里。它还会根据接下来的邮件继续训练自己,尤其是用户对其做了更正。该过滤器对我来说已经使得垃圾邮件得到控制,因为它每天可以剔除两三百条垃圾消息,并保留上百条“正常”的信息。它认为是“正常”信息而事实是垃圾邮件的可能性只占百分之一,但却几乎没有把标记为“好”的消息认为是垃圾邮件。该系统几乎与我辨别垃圾邮件能力一样,甚至还更有效。

马尔科夫模型。另一种模型基于马尔科夫过程,这种模型的特点是将概率随机网络转换为复杂序列。170马尔科夫(安德列·维奇·马尔科夫,1856—1922),因为建立了“马尔科夫链”而成为享誉世界的数学家。“马尔科夫链”在1923年被诺伯特·维纳(1894—1964)重新定义和完善。这个理论提出了一种估计一个可能发生事件序列概率的方法。这个理论经久不衰,例如,在语音识别领域,这个可能发生的事件序列就是音符。在语音识别领域,马尔科夫模型将会估计各种不同的音符模式,这些音符相互之间如何影响,还有可能出现的音符序列。这个系统在更高层的语言中引入随机网络,例如可以估计词语的出现概率。模型使用的实际概率是在实际的语言数据训练中得到的,因此其是自组织的。

马尔科夫建模是我和我的同事们都曾经在自己的语音识别领域研究用到的一种方法。171不同于音节方法,关于音符顺序的规律是人类语言学家已经规定好的,我们既没有告诉系统在英语中大约有44个英语音素,也没有告诉它什么样的序列出现的概率比其他的概率大。我们让系统从数千小时的录音数据中发现这些规律。这种方式的优势就在于能发现人类专家不能发现的微妙规律。

神经网络模型。神经网络是另一种流行的自我组织的方法,也被用在语音识别和其他多种模式识别的任务中。这项技术涉及模拟简化模型和神经元网络连接。一个基本的神经网络描述如下:每一个给定输入点(对于语音,每个点代表两个维度,频率和时间;对于图片,每个点表示二维图像中的一个像素)被随机连接到第一层的模拟神经元中。每个连接都有一个关联的突触的强度,代表其重要性,这是一个随机值。每个神经元将发给它的信号合并起来。如果合并后的信号超过某一阈值,神经元被激发并且向其连接地输出一个信号;如果合并后的输入信号不超过阈值,不会激发神经元,它的输出是零。每个神经元的输出都被随机连接到神经元的下一层。一般会有多层(一般3个或以上),并且这些层要被丰富地配置。例如,一个层可以反馈到前一层。在顶层,一个或更多的神经元为随机的选择提供答案。(有关的神经网络算法的说明,请参见本章后注释172)。

由于神经网络的布线和突触权重的初始化都是随机的,所以一个未经训练的神经网络的答案也是随机的。一个神经网络的关键是学习它的主题。如同人类对哺乳动物大脑很浅显地认知上,神经网络开始了我们对于无知的探索。神经网络的老师可能是人,也可能是一个计算机程序,甚至是另一种更成熟的经过训练的神经网络,当它生成正确的输出时会奖励它,当然也会惩罚它。这反过来又会反馈给这个学习中的神经网络,以调整每个神经元间的强度。与正确结果一致的连接会被加强,产生错误结果的连接将会被削弱。随着时间推移,该神经网络会在没有老师的帮助下产生正确的答案。实验表明,神经网络甚至能够从不可靠的老师那里学到知识。即使老师只有在60%的时间内是正确的,但是它仍然会汲取营养。

一个强大的、经过良好学习的神经网络可以仿真许多人类识别方面的才能。多种多样的采用多层神经网络的系统在模式识别中表现出令人印象深刻的能力,包括手写识别、人脸识别,在商业交易中的欺诈行为,如信用卡交易欺诈,等等。我在使用神经网络进行上述研究的经验就是最具挑战性的工作不是如何编码实现它,而是为它们提供自动学习的能力。

由于在大脑逆向工程中我们开发了详细的神经功能模型,神经网络目前的趋势是采取实际的生物神经网络工作的机理,实现更现实和更复杂的模型。173由于在自我组织的模式方面有了几十年的经验,因此在大脑研究方面的新进展可以迅速地用到神经网络的实验中去。

神经网络也是并行处理的过程,因为大脑就是这样工作的。人类的大脑没有一个中央处理机来模拟每个神经元。相反,我们可以考虑每一个神经元和每个神经元之间的连接是一个独立的、运行速度较慢的处理器。目前广泛开展的工作是开发专门的芯片,实现并行神经网络体系结构,从本质上提供更大的产出和效率。174

遗传算法(Genetic Algorithms,GA)。另一个源于自然的自我组织的灵感是遗传算法,或称为进化算法。算法的思路是模拟进化,包括有性繁殖和突变。下面是一个对它们如何工作的简单描述。首先,对一个问题确定一种解决方法。如果这个问题是设计一个喷气发动机的最优化的参数,那么这个问题就是确定一系列的参数(包括这些参数的类型和所占空间的大小)。这些参数在遗传算法里称为遗传密码。然后,随机产生数以千计的遗传密码。每个这种遗传密码(代表了一种方案的参数)被看做是模拟解决方案的有机体。

接下来在模拟环境中使用确定的方法来评估每组参数,从而评估每个仿真的生物体。这一评价是遗传算法成功的关键。在例子中,我们将每个解决方案应用到喷气发动机的模拟上,通过采用已确定的评判标准,比如,油耗或者速度等,来确定这种解决方案的优劣。最好的解决办法是优胜劣汰。

每个幸存者将繁殖,直至达到自己的解决方案所要求的数量。以上过程是通过模拟有性繁殖完成的。换句话说,每一个新的解决方案来自其中一个父代的基因组合的一部分,另外的部分来自于另一个父代。通常不加以区分男女,这样足以使得任意两个个体产生后代。当它们繁殖时,允许发生一些基因突变。

我们现在定义了模拟繁殖后代的方式,然后重复这种方式,进行多代的繁殖进化。在每一代都要确定这种方式的改进程度。当两代之间的差异小于一定的阈值,或者说两代之间的差异性可以忽略不计,那么我们将停止这种方案的模拟进化。并且应用评判标准最好的那一代作为最终的选择。(对于遗传算法的算法描述,参看本章注释175。)

遗传算法的关键是算法的设计者没有直接使用程序来解决问题,相反,而是让各种情况一一出现,通过模拟竞争和改善反复完善这种算法。正如前面讨论的,生物进化适者生存,但是进展缓慢。因此,为了加强进化的智能,我们保留其优胜劣汰的鉴别力,但是同时也大大加快这种笨重的步伐。计算机运行速度足够快,使得可以在数小时、数天或数星期内模拟出许多代的进化。虽然我们还是在一次模拟中完成这个反复的过程,然而,既然让这种进化按照常规发展,那么我们将高度精练的方式加以应用,以加快问题的解决速度。

就像神经网络一样,遗传算法也是一种从杂乱无章的数据中挖掘出隐藏其中的精妙关系的方法。这种方法成功的关键就是对每一种可能的解决方案能够进行有效的评估。这种评估的速度要求必须快,因为每次模拟进化都可能产生成千上万的解决方法。

遗传算法善于处理拥有大量参数的问题,这些问题的参数数量庞大到无法精确地分析或者寻找最优解。例如,设计喷气式飞机的引擎,需要涉及上百个参数和数十种限制。通用电气公司的研究员们使用遗传算法设计的引擎比使用传统方法具有更精确的结果。

当你使用遗传算法时,一定要注意你要求的结果。苏塞克斯大学的研究人员乔恩·巴德曾经用遗传算法优化振荡电路的设计。通过反复尝试使用少量的晶体管的传统设计,最优的设计是一个简单的无线电电路,而不是振荡器。很显然的是,遗传算法发现了从临近计算机发射出的无线电波。176基于遗传算法的解决方案只有在确切的位置才能确定最佳的解决方案。

遗传算法作为混沌和复杂性理论的一部分,越来越多地应用在解决复杂的商业业务问题上,比如优化供应链。这种方法正在开始成为整个行业的分析方法。这种模式也正在应用到模式识别,并且经常和神经网络等自组织的方法结合起来。同时这也是一个比较合理地编写计算机软件,特别是那些需要协调资源竞争的微妙平衡的软件。

克里·多克托罗是一位著名的科幻小说家,他在小说《usr/bin/god》中使用了一个有趣的通过遗传算法产生的AI。通过遗传算法(GA)将许多复杂的技术相结合,能够产生许多智能系统,每一次结合都是以遗传密码为特征。然后这些系统通过遗传算法来进化。

评价功能的方法如下:每个系统登录到不同的聊天室,并且假冒成一个人进行聊天,实际上这是一个秘密的图灵测试。如果这个聊天室的一个人发现了这个聊天机器人,那么评估就结束了,这个系统就停止进一步的优化,并且将它的成绩报告给GA。这个成绩是由它与人类对话时间的长短来决定的。GA通过逐渐的进化来提高它的智能性。

尽管它仅仅是在系统具有一定的智能性时才会使用可预期的时间进行评估,实现上述理念的主要困难是评价进化的功能需要大量的时间。同样,进行评估时可以很大程度上地使用并行。只要我们认识到问题的核心,向GA中注入成熟的算法,那么进化到图灵的智能是可以现实的。这是一个很有趣和有用的可以通过图灵测试的方法。

递归搜索。有时为了得到一个问题的解决方法,我们需要在大量的可能解中进行搜索。一个经典的例子就是玩游戏,比如下棋。一个玩家为了走一步棋,他需要想到所有可能的走法,以及每种走法可能会引起的结果,等等。然而,对于人类来说,把所有走法的序列记起来是不可能的,他们必须依靠经验分析每种情况来确定下一步的走法,而计算机则依靠逻辑运算来分析数以百万计的走法。

这种逻辑树是大部分游戏的核心。现在我们考虑一下如何才能做到这一点。我们建立一个称为选择最佳下一步的程序。这个程序可以罗列出所有可能的走法(如果不是一个游戏而是解决一个数学理论问题,这个程序需要在一个证明中罗列出所有的下一步的可能算法),对于每步走法,程序会建立一个由这种走法而引起的所有可能性的表。对于每个表,我们需要考虑如果这么走,我们能遇到的所有情况。现在递归出现了,因为这个程序被自己调用(Pick Best Next Step,从名字就可以看出)来确定最佳的下一步走法。在调用自己后,程序会列出所有可能的走法。

这个程序不断调用自己,在给定的时间内尽可能多地考虑未来的走法,这样就会产生以指数型增长的逻辑处理树。这是另外一个以指数增长的例子,因为预先处理以后的走法或者说是对策需要大约5倍于现在的计算量。递推公式成功的关键是逻辑树的裁剪,并且最终能够停止增长。在游戏中,如果在一点上的每种走法都行不通,那么程序会在这一点(称为这个树的叶节点)结束逻辑树的增长,并且考虑最优的能够导致成功或者失败的走法。当所有的递归的程序调用结束时,程序就能在一定的递归深度下,在一定的时间限制内得到最优的走法。(了解更多的递归算法,参见本章注释177)。

递推公式在数学方面往往是相当高效的。不仅仅是游戏中的移动,这种递推已经在数学领域解决并证明了定理。在每个点的扩展都是能够用公理(或以前的定理证明)证明的(这是纽厄尔、肖和西蒙斯的通用问题求解程序使用的方法。)

从这些例子可以看出,递归仅仅适用于那些可以清晰定义规律并且目标也很明确的问题。但它在计算机艺术创作领域却给了我们很多惊喜。例如,我曾经设计过一个使用了递归方法的叫做Ray Kurzweils Cybernetic Poet的程序。178这个程序对于每个词都建立了一套目标:达到一定音律、诗的结构、诗的画龙点睛的地方。如果它无法找到一个符合上述目标的词,它就备份并删除前一个词,按照原来的标准重新开始寻找所期望的词。如此循环往复的寻找。如果所有路径都导致死角。如果最终所有的寻找都是徒劳的,那么它会放宽一些限制,重新寻找。

图 5-3

深弗里茨的平局:是人类在变得聪明,还是机器在变得愚蠢?

在计算机国际象棋比赛世界里,我们找到一个在软件上有好转的例子,即按照通常的看法,这些是靠计算机硬件的蛮力来统治的。在2002年10月的国际象棋锦标赛上,一流的选手弗拉基米尔·克拉姆尼克与深弗里茨软件打成平局。我想指出的是,深弗里茨很有效,只用到先前的冠军——深蓝1.3%计算能力。尽管这样,但是它下棋的水平几乎没有下降,这是因为其基于模式识别的优秀的剪枝算法(后面将会解释)。在6年之内,一个像深弗里茨的程序将拥有深蓝的能力,每秒分析2亿个棋盘位置。运行在个人计算机上的类似深弗里茨的下棋程序,将在这10年之内,再一次击败所有人类。

在我1986年到1989年间曾写的书《The Age of Intelligent Machines》中,我已经预言,在20世纪90年代末,计算机将击败人类国际象棋冠军。我也曾提到,计算机在国际象棋等级上,每年增长约45个百分点,反观人类最好的选手,本质上已经定型,所以1998年迎来了交点。的确,在1997年铺天盖地宣传的世界锦标赛上,深蓝确实击败了盖里·卡斯帕罗夫。

但是,在深弗里茨与克拉姆尼克的比赛上,目前本届的计算机程序只能够打成平局。距深蓝的胜利已经过去了5年,那么我们怎么解释这种情况呢?我们应该可以总结出:

1)是人类越来越聪明,还是机器越来越愚蠢?

2)计算机在下棋上变得糟糕?如果这样,我们可以总结出,在过去的5年里,众多宣传计算机速度方面的提高并不像人们说的那么好?还是计算机软件变得糟糕,至少在下棋上是这样?

专用硬件的优势

上面的两个结论没有一个是确定的。目前的结论是软件正在变好,因为深弗里茨本质上已经敌得过深蓝,而且利用更少的计算资源。为了获得更多关于这个问题的深刻理解,我们需要测试一些必要条件。当我在20世纪80年代末写下计算机下棋的预测时,卡内基·梅隆大学开始着手编写一种程序,用来开发专门的芯片来指挥“极大极小”算法(游戏博弈标准的理论,依赖于建立博弈序列的树,然后评估树的每个分支的终点叶子位置),特别是用来计算棋路。

基于此专用硬件,1988年卡内基·梅隆大学的下棋机器HiTech它已能够每秒分析175000个棋盘位置。它下棋的等级已经达到2359,只比人类的世界冠军约低440个点。

一年以后的1989年,卡内基·梅隆大学的深思机器将性能提高到每秒分析1000 000个棋盘位置,等级达到2 400。IBM最后接管该项目,重新改名为深蓝,但是仍采用卡内基·梅隆大学的基础体系结构。1997年,击败卡斯帕罗夫的深蓝拥有256个并行工作的专用下棋处理器,每秒可分析2亿个棋盘位置。

注意专用硬件的使用是很重要的,用它来加速特殊运算,需要为棋子移动生成极大极小算法。众所周知,专用硬件计算机系统设计器一般执行一个特殊算法可以比通用计算机至少快100倍。专用的ASICs(专用集成电路)需要很大的开发工作和消耗,如果不是重复基准所需的临界运算(例如,编码MP3文件或者为电子游戏渲染图形基元),这项花费还是非常值得的。

深蓝对抗深弗里茨

由于总是有大量的焦点聚焦在里程碑式的事件上,计算机有能力打败人类对手,所以寄希望于专用象棋电路的支持是有用的。虽然关于深蓝对卡斯帕罗夫比赛的参数保持了一定热度的争论,但是人们对计算机下棋的兴趣自1997年后非常明显地衰落。毕竟,目标已经达到了,再去白费力气,意义不大。因此,IBM取消了该项计划,从此以后再没有关于专用下棋芯片的工作。人工智能的诸多领域的研究关注点已经不再是重大的结论,而是像导航飞机、导弹、工厂机器人、理解自然语言、诊断心电图和血液细胞图像、侦测信用卡欺骗,以及大量其他人工智能狭义上的应用。

尽管如此,计算机硬件仍呈指数增长,自从1997年以来,个人计算机计算速度每年翻一番。因此,深弗里茨的专用奔腾处理器大约比1997年的处理器快32倍。深弗里茨仅用8台个人计算机组成的网络,所以硬件上相当于256台1997水准的个人计算机,每一台都比1997年的个人计算机约快100倍(当然,这是计算下棋的极大极小算法)。所以,深蓝比1997年的PC机快上25600倍,比深弗里茨快100倍。这项分析可以由两个已经报道的系统速度来确认:深蓝可以每秒分析2亿个棋盘位置,而深弗里茨仅约为2500 000个。

重大的软件收益

由此,我们能对深弗里茨的软件说什么呢?尽管下棋机器通常被看做暴力计算的例子,但是这些系统有一个重要的方面,就是需要定性的判断。一系列的移动-反对移动可能带来的组合爆炸更为可怕。

在《The Age of Intelligent Machines》我曾预计,如果我们没有成功地对移动-反对移动树剪枝,或者试图在一场典型的比赛中走一步完美的妙棋,那样大约需要400亿年来移动一步棋子(假设一场典型比赛约有三十步,每一步有8种可能的选择,那么得到830可能的移动序列)。因此,一个实用系统需要不断地修剪掉没有希望的作用线。这需要洞察力而且本质上是模式识别判断。

人类,即使是世界级国际象棋大师,完成极大极小算法也非常缓慢,通常比每秒一个移动-反对移动的分析要慢。所以一个国际象棋大师究竟能否与计算机系统对抗?回答是,我们控制了强大的模式识别,可以使我们利用极好的洞察力来进行剪枝。

准确地说,在这个领域,对深弗里茨的改进已经超越了深蓝,深弗里茨只比卡内基·梅隆大学的深思具有一些微小的有效计算能力,但是被认为高出几乎400点。

人类国际象棋玩家注定失败?

我在《The Age of Intelligent Machines》里做的另一个预言是,一旦计算机在国际象棋比赛方面做的跟人类一样好甚至更好,那么我们不是更多地思考计算机智能就是较少地关注人类智能,或者较少提及国际象棋,如果历史是向导,结局很可能是这样。的确,它恰恰发生了。在深蓝胜利后不久,我们开始听到很多关于国际象棋只是简单的组合计算游戏的说法,计算机的胜利只证明它是个好的计算器。

事实上稍微复杂些。人类在国际象棋的良好表现显然不能归于我们的计算技术,事实上我们的计算技术还是很糟糕的。我们使用典型人类的判断形势来弥补缺点。对于这种定性判断的形式,深弗里茨比早先的系统表现出真正的进步。(附带提及,人类在过去5年并没有进步,人类最高积分保持在2800以下。从2004年起,卡斯帕罗夫的等级是2795,克拉姆尼克是2 794。)

我们该去向哪里?既然计算机下棋依赖于普通个人计算机上运行的软件,下棋程序将继续从持续增长的计算能力中获益。到2009年,一个类似深弗里茨的程序将再次达到深蓝的能力,每秒分析2亿个棋盘位置。随着互联网计算成果带来的机会,我们将能够早于2009几年达到这个可能。(计算机的互联网成果将需要更多无所不在的交流宽频带,但是这已经到来。)

随着这些必然的增长速度,以及模式识别持续不断地提高,计算机下棋等级将继续升高。在这个10年里,普通个人计算机上运行的类似深弗里茨的程序不久将再次打败所有人类。那时,我们将彻底失去对国际象棋的兴趣。

组合方法。组合方法是最强大的构建AI系统的方法,它仿真人类大脑的工作方法。正如前面讨论的,人的大脑不是一个巨大的神经网络,而是包含了数百个区域,每个区域都以不同的方式优化处理所负责的问题。

没有一个区域能够单单依靠自身的操作而达到人类的水平,但是所有的区域在整个大脑系统中被精妙地设计,可以准确地完成人类的各项工作。

我曾经在做AI相关的工作时使用过这种方法,尤其是在模式识别方面。举例来说,在语音识别中,根据经验与范例我们可以实现一些不同的识别系统。有的系统是专门按照专家的语言和语音知识建立的;有的是根据规则来分析句子(这就涉及表现句子的单词使用情况的图,类似于小学时学的相关表格);有的是基于自组织技术,如马尔可夫模型,通过在图书馆中存储的录音和人们的演讲中广泛地进行训练。然后,我们做一个“专家管理”软件,以了解不同的“专家”的强度和弱点,然后通过组合这些结果来进行优化。在这种方式中,一个特殊的技术本身可能会产生不可靠的结果,却依然能有助于提高系统的整体准确度。

在AI工具箱中,有很多结合不同方法的复杂办法。例如,可以使用遗传算法为神经网络或者马尔科夫模型优化最优拓扑(节点和连接的组织)。使用遗传算法的神经网络的最终输出可以作为递归算法的控制参数。对于模式识别系统,我们还可以借助于强大的信号处理和图像处理技术。每个不同的应用需要不同的架构。计算机科学教授和人工智能的企业家本·哥特兹在人工智能领域整合不同技术的策略和架构方面已经发表了很多文章和专著。他提出的Novamente架构旨在提供一个通用人工智能框架。179

以上只是简单介绍了当前日益成熟的AI系统。对于AI技术的详尽讲解和阐述已经超出了本书的范畴,甚至现在一个计算机科学的博士课程也不能包含现有的技术。

接下来介绍的精密AI系统使用各种方法来对每个特殊的任务进行整合与优化。精密AI系统由于顺应了现在的发展趋势而得到不断加强:计算可用资源呈指数级增长,现实世界中已经存在成千上万的智能应用,对于人类大脑机理的深刻认识正在不断深化。

一个狭义AI的例子

在20世纪80年代末,我写了我的第一部关于AI的书《The Age of Intelligent Machines》。我花费了很大的力气做了一些调查,以查找一些在实践中成功的AI例子。那个时代互联网还没有普及,我不得不去图书馆和AI研究中心,足迹遍及美国、欧洲和亚洲。我将所有我认为可以作为合理的例子都收录在我的书中。我沉浸在数以千计的令人欣喜的例子中。在KurzweilAI.net网站上,我们几乎每天都会报告至少一个梦幻般的系统。180

商务通信公司(Business Communications Company)2003年预测在2007年181,AI的市场规模达到了210亿美元,2002~2007年的平均增长率为12.2%。领先的AI应用的行业包括商业智能、客户关系、金融、国防和国内安全和教育。下面介绍一个小型的正在使用的精密AI系统。

军用智能。美国军方一直是AI系统的狂热爱好者。模式识别软件系统可以引导如巡航导弹飞行数千公里攻击特定的建筑物。182尽管已经获得导弹飞跃地形的详细资料,但是由于存在天气、地面覆盖物和其他因素,因此需要一个灵活的实时图像处理程序来实施具体的处理。

军队已经开发出自组织通信网络(称为“网状网络”)的原型。当一组节点进入新的位置时,它们能自动配置数以千计的网络节点。183

专家系统结合贝叶斯网络和遗传算法,用以优化复杂的供应链,可以协调补给链,包括数以百万计的备用物资、供应品和武器,这些物资的供应都将基于快速变化的战场需求。

AI系统还可以模拟武器的性能,包括核爆炸以及导弹发射。

美国国家安全局(NSA)基于AI的Echelon(埃施朗)系统,在2001年9月11号前,通过分析公共交通监控信号,发出过存在明显恐怖袭击的警告。184遗憾的是,Echelon的警告没有得到重视,所以酿成了惨剧。

2002年在阿富汗的军事行动中见证了“捕食者”的首次亮相(美国无人战斗机)。无人机尽管已经发展了许多年,但直到在其上装载了导弹才证明它是非常成功的。在2003年伊拉克战争中,武装了的“捕食者”(由中央情报局操纵)和其他无人机摧毁了数以千计的敌人坦克和导弹发射点。

所有的军事服务都正在采用机器人技术。军队利用该技术搜索洞穴(在阿富汗)和建筑物。海军使用小型机器人船只保护航空母舰。正如我将要在第6章讨论的,使士兵远离战场是一个越来越明显的趋势。

太空探索。美国航天局现在正试图将自我控制加入到无人航天器的软件中去。因为火星距离地球大约是3光分钟,木星大约为40光分钟(取决于行星的确切位置),航天器与地球的控制器之间的通信存在明显的延时。由于这个原因软件需要拥有重要的决策能力。为了做到这一点,美国宇航局正在设计软件,包括该软件的自身能力模型和一艘飞船,以及完成每个任务可能遇到的挑战。这种人工智能的系统都能够通过新的形势来做决定而不仅仅是在已经设定的规则下进行推理。这种方法使得航天器可以深入太空。1999年一个飞船使用自有的知识设计了一系列的解决方法,避免了导致本次探索失败的危险185。AI系统的第一个计划失败了,但它的第二个计划完成了使命。“这些系统有一个关于内部元件物理性质的常识性模型”,布莱恩·威廉姆这样解释。布莱恩是深入太空智能软件的首创者,现为美国麻省理工学院太空系统和人工智能实验室的科学家。他还提到,“飞船可以从这一模型中进行推理,以确定哪些是错误的,并且如何采取行动”。

美国航天局使用计算机网络通过遗传算法发展三维空间技术的天线设计,使用5颗卫星来研究地球的电磁场。数以百万计的设计在这次模拟进化中竞争。美国航天局的科学家和项目领导杰森·罗翰提到,“我们使用遗传算法来设计微观机器,包括陀螺仪,并用于航天导航。软件还有可能发现人们永远不可能想到的解决方案”。186

另一个AI系统可以将行星从分辨率很低的宇宙图像中辨别出来,其精度超过了这个领域的人类专家。

新的陆地机器人望远镜能够决定在哪里观察,并且懂得如何提高找到期望情况的可能性。称为“自主、半智能观测站”的系统能够适应天气,注意感兴趣的项目,并且自主决定如何跟踪它们。它们能够检测到非常微弱的太空现象,比如一个行星仅仅一纳秒的闪烁,这可能说明我们的太阳系接收到了来自外宇宙的一个光线。187一个称为运动目标和瞬态事件查询系统(MOTESS)的类似系统曾经在其投入使用的前两年,发现了180颗新的小行星和彗星。“我们有一个智能观测系统”,英国埃克塞特大学的天文学家阿拉斯代尔艾伦解释说,“它能够思考并且能自主做出决定,决定对某些观测是继续还是放弃。如果需要更多的观测,它就将继续并且得到想要的结果。”

类似的系统还被军方用来自动分析来自间谍卫星的数据。目前的卫星技术能够观测到地面上约1英寸大小的面积,而不受恶劣天气、云或黑暗的影响。188在海量数据不断产生的情况下,如果没有自动图像识别的方案,就不能从相关的联系中得到规律。

医学。如果你拿到一张心电图(ECG),医生就有可能通过适用于心电图记录的识别模式得到自动诊断。为了进行长期不引人注目地监测(嵌入衣服中的viasensors和无限通信使用手机)心脏病的早期症状,Kurzweil Technologies公司正在和United Therapeutics合作开发新一代的对心电图的自动分析。189其他的识别模式系统被用于诊断大量的图像资料。

每个主要的药物开发者都在使用人工智能程序进行模式识别,以及挖掘新药物疗法发展领域中的有用数据。例如SRI国际公司正在建立一个灵活的知识库,该知识库将我们所知道的有关典型疾病的所有事情进行了编码,包括肺结核和幽门螺旋菌(引起溃疡的细菌)190。这样做的目的是应用智能的数据挖掘工具(能够寻找出数据间新联系的软件)找出破坏或中断这些病原体代谢的新方法。

相似的系统被用于演示其他疾病的新型医疗方法,并自动发现和理解基因的功能,以及它们在疾病中的角色。191例如,阿尔伯特实验室宣称,一个新的实验室里配有AI机器人、数据分析系统和6个研究者,能完成以前拥有200名科学家的药物发展实验室的工作。192

前列腺特殊抗原(PSA)水平偏高的男性通常要经历外科手术,但是这些男性中的75%没有患前列腺癌。一个以血液中的蛋白质的模式识别为基础的新测试将会使这个错误的阳性比率下降到大约29%。193这个测试是建立在由马里兰州贝塞斯达的Correlogic系统设计的AI程序的基础上,准确性将会得到进一步的改进。

应用于蛋白质的模式识别同时也可以用于检测卵巢癌。当代最好的卵巢癌检测是和超音波检测一起使用的CA-125,它能发现几乎所有的处于早期阶段的肿瘤。“通过长期的诊断发现卵巢癌十分致命,”FDA和美国癌症研究所经营的临床蛋白质组织程序的伊曼纽尔·帕特克因三世说。帕特克因是以AI为基础的新型测试的领先研究者,该测试可以寻找能在目前的癌症中发现的独特蛋白质模式。在一项包含数以百计的血样评估中,根据帕特克因的说法,测试结果表明,“可以100%地发现癌症,即使癌症还在早期阶段”。194

在美国几乎10%的柏氏抹片是由名为FocalPoint的自动化AI程序分析进行的,其发明者是TriPath Imaging公司。研究者们开始用他们的标准去面试病理学家的职位。AI系统通过观看病理专家继续学习。只有最好的人类诊断家才允许被该程序观察。“这是专家系统的优点”,Tri-Path的技术产品经理鲍勃·施密特解释说,“它只允许你复制该领域最优秀的人。”

俄亥俄州立大学健康组织已经建立了以囊括多个专业、大量知识并以专家体系为基础的CPOE(computerized physician order-entry)系统。195这个系统能够自动检测很多内容,如病人中可能的过敏者、药物的相互作用、年纪大者、药物限制、剂量指南和适当性等病人的相关信息,这些信息来自医院的实验室和放射科。

自然科学和数学。威尔士大学基于综合的AI系统发明了“机器人科学家”,该系统能明确地叙述基本理论。这个机器人科学家是一个能自动进行实验的机器人系统,同时也是一个评价结果的推理机。研究者根据在酵母中的基因表达模式创造了该系统。这个系统“可以自动地产生假说来解释所观察的现象,设计实验来验证这些假设,用实验室的机器人来真正地进行实验,解释伪造与数据不符的假设所造成的后果,然后重复整个过程”196。该系统能够通过其自身的经验来改善其性能。人类科学家设计的实验比机器人科学家设计的实验贵3倍。机器的测验与一群人类科学家的测验对比表明机器所发现的东西比得上人类所发现的东西。

威尔士大学的生物系主任迈克·杨是从事机器研究的人类科学家之一。他解释说:“机器人打败了我,但那仅仅是因为在那一刻我按错了键。”

一个长期存在的关于代数学的猜测最终被阿尔贡美国实验室的人工智能系统证明。人类数学家称这个证明是具有创造性的。

商业、经济和制造业。每个产业的公司都在用人工智能系统控制和完善物流,发现欺诈和洗钱,以及将智能数据挖掘技术应用于他们每天收集到的大量信息。例如,沃尔玛从顾客的交易中获得大量的信息。人工智能工具用神经网络和专家系统对这些数据进行分析,从而为经理提供市场调查报告。这种智能信息挖掘技术能够使他们为每天每个商场对每种产品的需求清单进行非常准确的预测。197

人工智能程序通常也用于发现金融交易中的欺诈行为。例如,一个叫Future Rout的英国公司用以牛津大学研究的人工智能为基础的iHex系统去发现信用卡交易和贷款申请中的欺诈。198这个系统能够根据经验不断地产生和更新自己的标准。在美国北卡罗来纳州夏洛特的“第一庭权益联合银行”用Loan Arranger系统(类似于人工智能系统)决定是否批准抵押申请。199

全国证券交易商自动报价系统协会(NASDAQ)也在使用一种名为Securities Observation,News Analysis,Regulation(SONAR)的系统去监督欺诈交易和可能存在的内部交易。200到2003年年末,SONAR发现了180多起事件,这其中涉及美国证、证券交易委员会和司法部。这其中的一些案件在事后被作为重要新闻报道。

1972~1997年,麻省理工学院AI实验室的领导者帕特里克·温斯顿建立的Ascent Technology公司已经设计了一个名为Smart-Airport Operations Center(SAOC)的系统,该系统也是基于基因算法的。它能够处理飞机场的复杂后勤,如平衡众多员工的工作分配,协调部门和设备的工作分配,并管理其他无数的细节。201温斯顿指出:“找出方法去处理复杂的情况正是基因算法所做的事。”应用SAOC的机场的生产率提高了大约30%。

Ascent公司的第一份合同就是将它的人工智能技术用来管理1991年在伊拉克的“沙尘暴行动”的后勤。防御远景研究规划局(DARPA)声称基于Ascent系统的人工智能逻辑计划系统创造的价值将大于政府在过去十几年中对人工智能的研究的投入。

软件领域的一个新的发展趋势是用人工智能系统处理复杂的软件程序演示,发现故障,并在没有人类指示的情况下选择最好的方法自动恢复202。实现该功能的一个主要思想是:随着软件系统越来越复杂(像人一样),它们不可能完美,除去所有的漏洞是不可能的。AI系统和人类采用相同的策略:“我们不期望完美,但我们经常试着从不可避免的错误中恢复过来。”“我想让这个系统用自己的头脑进行管理”,斯坦福大学的软件基础设施集团的领导者阿曼多·福克斯说他正在进行自动计算的研究。福克斯补充道:“这个系统必须自己建立自己,完善自己,修理自己,当出现错误的时候它必须知道如何应对这种客观的威胁。”IBM、微软和其他的软件厂商正在开发融合了自治能力的系统。

制造业和机器人技术。计算机集成制造(Computer-integrated manufacturing,CIM)越来越多地使用人工智能技术完善资源的利用,使后勤合理化,并及时通过购买部件和物资减少清单。CIM的一个新趋势是用“基于事件的推理”,而不用硬编码的基于规则的专家系统。这些推理代码的知识源于“事例”,而这些事例是解决问题的方法。最初的事例是由工程师设计的,一个成功的事例论证系统的关键是它能从实际经验中不断获取新事例的能力。这个系统能够应用推理在其存储的众多事例中找到适用于新情况的解决办法。

机器人已广泛地用于制造业。最新一代的机器人使用了灵活的人工智能影像系统(该系统由一些公司建造,如马萨诸塞州的Cognex Corporation公司),它能应对各种情况。这降低了机器人正确执行操作时的精确度需求。加州一家自动化公司Adept Technologies的CEO布莱恩·卡莱尔指出:“即使劳动力的成本很低,智能机器人和其他智能设备之间的交互也是一个重大方面。除了质量和容量外,硬件工具在使用户接受产品转变和演变方面也是不可比拟的。”

人工智能专家汉斯·莫拉维茨成立了一家名为Seegrid的公司,该公司主要提供由其开发的视觉机器以便于完成制造、材料处理和某些军事任务。203莫拉维茨的软件可以使一个设备(机器人或者仅仅是一个材料处理车)在非结构化的环境中以步行或滚动方式运行,并且可以通过这种方式建立一个可靠的三维地图。该机器人可以利用此地图和它的计算能力来确定执行任务的最佳路径。

这项技术使得不需要前期繁琐的预编程,便能使智能机器在生产过程中传输生产材料。在军事方面,这种智能机器可以完成精确的任务,同时适应快速变化的地理环境和战场环境。

视觉机器也能够提高机器与人交流的能力。使用小型、廉价的相机就可以使得机器人识别人的头部和眼睛,以此实现自然界中的一种重要的交流方式——眼神交流。卡内基·梅隆大学和麻省理工学院的头部和脸部跟踪系统已经发展得比较完善,并且一些像Seeing Machines of Australia这样的小公司也已经开始提供这方面的服务。

视觉系统强大的另一个有力证明是:一辆由人工智能系统驾驶的无人车辆在没有人干预的情况下几乎从华盛顿特区开到了圣地亚哥。204美国Pittsburgh大学计算机科学教授、美国人工智能协会会长布鲁斯·布坝南说在10年前这是无法想象的事情。

帕洛阿尔托研究中心(Palo Alto Research Center,PARC)正在开发一个机器人,该机器人可以在诸如沙漠等复杂环境中进行导航,并且发现一些可能重要的目标,例如找到一个受伤的人。2004年9月在对圣何塞举办的一个人工智能会议上,他们在模拟环境中展示了一些自我组织用于现实受灾地区的机器人。205这些机器人可以在崎岖的地形上移动,可以相互交流,组织处理图像,并且通过体温来寻找人类。

演讲和语言。自然语言处理是人工智能方面最具挑战性的一项任务。不需要技巧,不需要完全掌握人类的智慧,电脑系统就可以实现基于文字的令人信服地与人交流。图灵所设计的图灵测试也完全是基于书面语言的。

虽然达不到人类的水平,但是自然语言处理系统也在稳步前进。搜索引擎已经变得如此流行,以至于"Google"已经从一个专有名词转变成了一个公用的动词,它的技术已经革命性地改变了研究和获取知识的方式。Google和其他搜索引擎都使用基于人工智能的统计学方法和逻辑判断来决定链接的排名。这些搜索引擎的缺点在于它们无法理解被搜索词语的意思。虽然有经验的用户会设计一个关键词的序列寻找最相关的站点(例如:搜索“电脑芯片”可能会比搜索“芯片”更有效率),但是我们最希望的是用自然语言进行搜索。微软已经开发出了一套自然语言搜索引擎Ask MSR(Ask Micro-Soft Research),这个搜索引擎可以回答自然语言的问题,如:“米奇·曼陀什么时候出生?”206在系统将这句话按照词类(动词、名词等)进行解析之后,一个特殊的搜索引擎将会基于这些词找到匹配项。系统将会找到匹配的文档以回答这个问题并进行排序。正确的答案被排在前三位的概率至少有75%,而且通常不正确的答案将会非常明显(例如:米奇·曼陀出生在3)。研究人员希望可以包含一些知识,这样就可以降低错误答案出现的概率。

曾领导Ask MSR项目的微软研究员埃里克·布里尔,尝试完成一个更艰难的工作:建立一个可以用大约50个词的句子回答一些更复杂问题,例如:“如何才能获得诺贝尔奖?”这个系统所用的其中一个策略就是在网络上找一个适当的FAQ段来回答这些问题。

自然语言系统包括大量的词汇,电话中非特定语者语音识别已经进入市场并可以用于处理日常的事务。你可以询问大英航空公司虚拟旅行代理人任何已经录入的大英航空公司的航班。207假如你需要Verizon公司的客服或者需要查尔斯·施瓦布和美琳·林奇帮你做财务汇报,你也可以通过与一个虚拟人类对话来获得。尽管这些系统会令有些人厌烦,但是这些系统对于人们的日常口语确实可以做出比较快和比较适当的反应。微软和其他一些公司正在提供一些系统,这些系统可以通过交互、合理而自然的对话来预定诸如旅店、旅行并处理常规的交易。

虽然并不是所有的人都对这些虚拟代理人的工作能力感到满意,但是大多数系统都提供获得真人在线帮助的功能。使用这些系统的公司报告说他们已经将需要使用人力的服务减少为原来的80%。除了可以省钱以外,接线员的减少也带来了一些管理上的利益。因为很多人对工作不满意,所以接线员的需求量非常大。

据说大多数男人都不愿问路,但是汽车厂商证明不管是男人还是女人都愿意向自己的汽车问路。2005年,Acura RL和Honda Odyssey将会通过IBM提供的一套系统允许驾驶员和他们的汽车进行对话。208汽车导航将会包含街道的名字(例如,在Main Street左拐,然后在Second Avenue右拐)。驾驶员可以提出诸如“最近的意大利餐馆在哪”的问题,或者可以进入特定的位置清楚地问路,然后给出汽车指令(例如,“打开空调”)。Acura RL还将在它的屏幕上实时显示交通拥挤程度。

语言识别系统号称是独立于说话者的,不受引擎声音、风声和其他噪音影响。据报道,这个系统能够识别170万个街道和城市的名称,并且可以执行大约1000条指令。

计算机语言翻译正在稳步发展。因为这是一个图灵级的问题,即需要完全达到人理解语言的级别才能像人一样熟练地完成任务。这将是最新的能够与人类行为相媲美的应用领域。美国加利福尼亚南部的一个计算机专家弗朗茨·约瑟夫·奥克已经开发了一种用大约几小时或几天时间就能在任何语言之间进行翻译的系统。209他所需要的仅仅是"Rosetta stone"——一种语言的文本,以及该文本对应的另一种语言的翻译文本——尽管他需要这种翻译文本数百万的文字。通过自组织技术,这个系统可以为两种语言间的互译建立统计模型。

而其他的翻译系统需要语言学家费尽心机地建立语法规则,对于每个规则还需要处理大量的异常情况。最近在美国商务部国家标准与技术研究所举办的翻译系统竞赛中,Och的系统获得了很高的评分。

娱乐和体育。遗传算法有一个很有趣又吸引人的应用,牛津大学的一个科学家托马斯·瑞尔利用仿真的关节、肌肉和一个大脑神经网络创造了一个活生生的生物。然后他给这些生物下达指令:行走。他用了一个具有700个参数的遗传算法来实现这种能力。瑞尔说:“假如你用人眼观察这个系统,你永远也不能完成它,因为这个系统太复杂了,这就是进化所能达到的效果。”210

在这些“生物”平稳、令人信服地行走的同时,这项研究展示了遗传算法的一个著名属性:你将得到你所想要的。一些“生物”想出新颖的方法来代替行走。瑞尔提出:“我们有一些‘生物’根本不能行走,但是可以采用一些奇特的方法来向前行进:爬行或者翻跟斗。”

软件已经发展到可以从一些体育视频中自动提取更重要的视频。211都柏林的三一学院的一个团队正在开发一种类似于台球的桌面撞球游戏,在这种游戏中软件可以追踪每个球的位置并且可以识别一些重要的射门。佛罗伦萨大学的一个团队以足球作为研究对象,这个软件追踪每个队员,并且可以判断一种球的运动类型(例如任意球、射门等)、进球的时间、被处罚的时间和其他一些关键因素。

伦敦的大学学院的数字生物兴趣研究团队正在利用一些遗传算法设计一级方程式赛车。212

人工智能的冬季早已过去。我们已经进入了狭义人工智能的春天。前面介绍的这些例子都是10~50年前的研究项目。假如所有的人工智能系统突然都停止工作,那么我们的经济基础设施将会陷于停顿,银行将会停止交易,大多数的交通会受到重创,通信将终止,而在10年前则不会有如此大的影响。当然,就目前来说,我们的人工智能系统还不具备筹划类似阴谋的能力。

强人工智能

假如你只用一种方式去理解某件事,那么你并不能真正地理解这件事。这是因为假如有一个步骤发生错误,你将会被自己的思维所束缚。一件事对于我们的意义取决于如何把这件事同其他的事关联起来。这就是为什么我们说死记硬背不能理解其真正含义。然而,如果你有几种不同的思路,那么当其中一种失败时,你就可以用另一种思维去尝试。当然,如果将过多的不相关的事务连接起来,将会使自己陷入困惑。但是良好的连接可以使你多方位的转变思路,直到找到一个合适你自己的。这就是我们所说的思考!

——马文·明斯基213

提高计算机的性能就像水流蔓延的情景。大概半个世纪前,它开始灌溉低地,推进了人工计算器的发展,并改进了一些记录员的工作,但没有惠及大多数领域。现在,洪水已达到山麓,就连我们的哨所都在考虑撤退。在山峰上我们才能感到安全,但以目前的速度,高峰也将在另半个世纪被淹没。由于那一天的临近,我建议建一个方舟,并开始适应航海生活!但是现在,我们必须依靠我们在低地的代理人来告诉我们洪水的真正情况。

我们在山麓的代理人和理论向我们报告了智能的迹象。在数十年前我们为什么没有从低地获得如下的报告:电脑在计算和记忆力方面都强于人类?事实上在那个时代我们已经获得了同样的报告。当时计算机的计算效率能像成千上万的数学家加在一起一样,人们称其为“巨人的大脑”。这鼓舞了第一代人工智能的研究。毕竟机器在从事某些事情的时候超越了任何动物,因为机器包含了人类的智慧、专注和数年的训练。但是现在我们很难再体会到那种魔力。

其中的一个原因是计算机在其他领域愚蠢的表现造成了我们判断上的偏见。另一个原因就是我们自己的问题。我们确实费劲心力地计算和记录数据,使得一个复杂计算的每一个很小的机械步骤都很明显,然而这样庞大的描述往往超出了我们的能力范围。像制造的深蓝,从内部我们可以看到非常多的处理,而从外围我们可以欣赏它设计的精妙。但通过天气模拟的繁琐计算来预测出风暴和龙卷风,或者通过电影动画中的计算来表现栩栩如生的皮肤。这些不是显而易见的。我们很少称这些是智能。但相比人工智能,“人工现实”可能是更加深刻的概念。

潜藏在优秀人类棋手中的精神步骤和理论证明是复杂而又不可见的。无法进行机械式地解释。那些可以自然地理解这些过程的人使用策略、理解力和创造力来描述它,而不是使用精神语言。当机器能够以同样丰富的方式兼备意义和惊喜,那么我们就智能地用精神语言进行解释。当然,在这个场景的背后,程序员能够从原理上给出机械解释。但即便对于程序员来说,当运行程序向内存中填入需要理解的大量细节时,这种机械解释将是无效的。

就像上涨的洪水达到更多的居民居住地的高度,机器在众多领域的能力也会提高很多。机器的思考中存在的本能意识将逐渐普及。当最高的山峰被淹没,在各个领域,机器将具有与人类一样的智能。机器中思想的出现将是不容怀疑了。

——汉斯·莫拉维茨214

因为信息技术的指数级发展,其性能将由乏善可陈发展到令人惊叹。如前面几章所述,在很多不同的领域,狭义人工智能的表现已经让人印象深刻。机器使用人工智能可以完成的智能任务的范围正在不断地扩大。在我为《The Age of Spiritual Machines》一书设计的一张图片中(见图5-4),一个充满戒备的人类正在写出只有人类能做的事件标志(机器不能做到)。215地板上的是人类已经抛弃的标志,因为机器已经能够实现这些功能:心电图诊断、创作巴赫风格的曲子、识别人脸、引导火箭、打乒乓球、和国际象棋大师下棋、挑选股票、即兴爵士乐创作、证明重要定理和理解连续演讲。早在1999年,这些就不是只有人类智能领域能够完成的任务了,机器也可以完成所有的这些。

图5-4中那个人后面的墙象征着只有人类才能完成的任务,如具有常识、复述电影、举行记者招待会、翻译演讲、打扫房间和驾驶车辆。如果经过一些年后,我们重新设计这张图片,这些标志中的一些可能将落在地板上,当CYC达到上千万的常识知识时,人类可能在常识推理领域上的优势就不那么明显了。

图 5-4

家用机器人的时代已经开始了,虽然现在尚处于原始阶段,从现在开始的后10年,我们可能会考虑使用具有清理房间能力的计算机。对于驾驶车辆,没有人工干预的机器人已经在不同的交通道路上驾驶车辆,而且几乎可以穿越美国。我们不会让机器人掌控开车,但创建汽车能自己开的电子化高速公路是一个重要提议。

复述一部电影、举行记者招待会和翻译演讲,这3个任务是非常难的,只有达到人类对自然语言的理解才能办到。一旦我们取下那些标志,那么我们将会拥有新一代机器,那时强人工智能纪元将会到来。

这个纪元将会悄悄来到我们身边。只要在人类和机器行为之间存在差异,比如在一些领域只有人类才能做到而机器不能,那么强人工智能的怀疑者就会抓住这些差异不放。但我们的每一个技能和知识领域的经验都可能紧随卡斯帕罗夫。我们对机器行为的认识将会很快从毫无希望变成令人畏惧,如同指数函数的底数超出人类预计的范围一样。

强人工智能是如何到来的?本书中的大部分材料都已经设计出对硬件和软件的基本需求,并且解释了为什么我们确信在非生物系统中这些需求将会达到。计算性能的持续性指数级增长会使得硬件具有模拟人工智能的能力。这个观点在1999年依然存在争议。在过去5年中三维计算的发展取得了很大的进展。现在很少有资深评论员质疑它的发生。即便只使用半导体工业发布的ITRS路线图的预测,在2018年,只需要合理的花费就可以制造达到人类水平的硬件。216

为什么我们能这么自信地认为到20世纪20年代的后期能够实现人类大脑各部分的详细模型和模拟。在第4章就开始说明这种情况。直到最近,分析大脑内容的工具还不具有空间和时间解决方案,或者构造足够的数据去创造充分详细模型的实现成本太高。这些问题正在逐渐改善。在实时运行环境下,新出现的一代扫描和感知工具能够精准地分析和检测神经元和神经部件。

将来的工具应该具有更强的解决问题的能力。到了21世纪20年代,我们能够将扫描和感知纳米机器人送入人脑的毛细血管中,让它们从里面检查。我们已经具有了将不同来源(大脑扫描与感知)的数据转化为模型和计算机模拟的能力,而且可以与生物人在这些区域的性能相媲美。我们已经具有强大的模型,并且可以模拟大脑的一些重要区域的功能。就如在第4章讨论的,21世纪20年代后期人们将对所有大脑区域建立详细和现实的模型。

对强人工智能的推测是这样的:我们将在对所有大脑区域的逆向工程中学习到人类智能的实现原理。并且我们将应用这些理论到具有大脑智力能力的计算平台。这个将会在21世纪20年代实现。我们已经具有有效的工具来实现狭义人工智能。由于各种方法的持续改进,新算法的发现和各种方法向这个错综复杂体系融合的趋势,狭义人工智能将逐渐变得不是那么狭隘。这就是说人工智能的应用将有更广阔的领域。并且它们的表现会更加灵活。人工智能的发展将为解决不同的问题提供不同的方法。就像人一样。更重要的是,人脑逆向工程的加速发展将创造新的洞察力和范式,这将极大地丰富不断发展基础的工具集。这个过程正在很好地进行中。

经常会听到由于人脑与计算机的工作机理有很大的不同,所以不能够将关于脑功能的分析应用于可行的非生物系统。这个观点完全忽略了自组织系统领域。我们有一组逐渐改善的精密数学工具应用于该领域。正如我在之前的内容中所讨论的,人脑与当代普通的计算机相比,在很多重要方面都是不一样的。如果打开你的掌上电脑,切断里面的一根线,就会很轻松地破坏一台机器。我们经常失去很多神经元和神经元间的连接,但却没有产生负面影响。这是因为人脑具有自组织能力,并且依赖于分布式模式,所以很多特别的细节并不是很重要。

当我们到达21世纪20年代中晚期的时候,我们将能够制造出非常详细的人脑区域模型。最终这个工具将会逐渐丰富那些新的模型和模拟器并且能够包含人脑如何工作的完整知识。我们可以应用这个工具到智能任务中,并且将在整个范畴利用这个工具,一些工具来源于人脑的逆向工程,一些工具源于我们对人脑理解的灵感,还有一些工具不是基于人脑而是基于人工智能。

人脑策略的一部分是学习信息,而不是源于硬编码的知识(我们用“本能”这个词来特指内在的知识)。学习依然是人工智能的一个重要部分。在我的经验里,在发展模式识别系统如字符识别、语音识别和经济分析、培养AI的学习能力是最具挑战性的,同时也是工程的重要组成部分。在线的人类文明的知识积累将会越来越多,将来的人工智能将有机会通过学习大量的信息实体来获得教育。

对人工智能体的教育将比没有经过强化训练的人类快得多。一个生物人类需要25年的时间来完成基础教育,而人工智能体则可以压缩到数周或者更短的时间。并且,因为非生物智能具有分享学习和知识的模式,所以只需有一个人工智能体掌握特殊技能。就如我所指出的,我们可以训练实验室的一组计算机来理解对话,只要通过加载已经训练完成的模式到他们的电脑,那么成百上千的用户都可以获得我们的语音识别软件。

非生物智能的一项技能是通过对人脑的逆向工程实现掌握人类的语言和分享人类的知识,从而通过图灵测试。这个图灵测试是非常重要的,不仅是因为它重要的实际意义,更是因为它是一个决定性的阈值。正如我们之前指出的,通过图灵测试具有非常重要的意义,这不同于模拟人类智能的适应性、巧妙性和柔软性。在我们的技术中已经具备了这种能力,该能力通过功能的集中、聚焦而放大。

《奇点临近》