机器能思考吗?——《剑桥五重奏》
最近无意翻到一本《剑桥五重奏》,主要讨论的大概是机器思考的本质,机器是否可能具备“智能”?或者,引用副标题的话就是:
机器能思考吗?
该书成书于1997年IBM的超级计算机深蓝二号打败了国际象棋世界冠军卡斯帕罗夫之后,很巧的是,如今距离那个年代已经又过去了20年,人工智能在其间再落再起,时至今日,又被深度学习的浪潮推到一个新的高峰,Alpha GO又打败了围棋世界冠军,关于AI技术/伦理的讨论给未来笼上未知的迷雾,此刻回头再看看20年前人们同样的迷惘,或许也是件有趣的事情。
作者,数学家卡斯蒂虚构了1949年的一场晚宴,大笔一挥泼墨点下五位不同领域的巨人来讨论思维机器(thinking machine)。这五人分别是数学家,计算机的先驱阿兰·图灵;语言哲学家路德维格·维特根斯坦;量子力学奠基人之一,欧文·薛定谔;遗传学家,J.B.S.霍尔丹;以及晚宴的发起人,小说家兼物理学家CP.斯诺。
作者置图灵和维特根斯坦为辩论的主要正反方,其他人或附和或反驳或补充,图灵认为人脑也不过是一个复杂的计算系统,没有任何理由显示我们不能从技术上模拟出一个具有和人脑同样智能的计算系统,而维特根斯坦则坚定地捍卫人类思考的神圣性,薛定谔作为物理学家,更多地偏向于赞同图灵的观点,霍尔丹则以其对生物的理解,表示计算无法阐述所有的事情,但是同时他也不反对思维机器的可能性,而在这个问题上骑墙,斯诺作为主人,则需要穿针引线,不偏不倚地总结陈词。
全书前四章大概可以分为第一部分,此时辩论还没有那么激烈,各方还在提出各种观点“试探”对方,概括如下引用:
首先,图灵提出了著名的图灵测试,即第一我们判断机器智能不能从其内部架构来判断,因为我们可能判断的是和人类完全不同的智能体,其思维运作方式不见得为人类理解,如我们不能因为汽车不是通过两条腿前行而判断汽车无法“移动”;在此基础上,我们只能通过外部行为来判断机器智能,由此图灵引申出了图灵测试————如果对机器的广泛询问不能使我们将机器和人类区分开来,那我们就不能不承认机器拥有智能。
在我看来,图灵测试基本上还是大致符合我对智能的理解的,作为唯物论者要接受这点并不难(但是如果和二元论者那样,认为思考/心灵具有“非物理性”,那么就很难接受图灵测试了)。但是我觉得这个约束可能有些过于严苛了,例如我们将广泛的询问范围缩小到对弈上,人类在和机器下棋时还是能够感受到对方的“棋路”和人类有不同的,但是我们不能否认机器在下棋方面的智能。
然后,维特根斯坦提出了“中文房间”的概念(小说虚构,实际上中文房间的提出另有其人),我们将一个不懂中文的人关到一个有着一本包含足够多字符对应表(规则书)的房间中,并通过纸条和此人用中文通话,此人接收到纸条后按照书上的说明做出相应的解答并输出(对应机器的行为),虽然这一系统可以通过中文方面的图灵测试,但是我们不能说此人会中文,引申出来,该系统不能称之为“智能的”。其本质来讲,这个系统仅仅是在进行符号操作,但是单纯的符号操作无法产生确实的意义。(语言符号仅有在社会的情况下才拥有意义)
对于中文房间的思想实验,我们不难做出反驳,这个实验首先将接收纸条->查询规则->输出这一流程本身所需要的智能就抽象地忽视了,其次,即使我们不能称房间内的人“懂中文”,但是如果我们考虑整个房间这一系统(包括人和规则书),我们从图灵测试的角度来看,这一系统无疑是“懂中文”的。对应到人脑上来看,对于单个的脑细胞,其功能无非是缓冲,传递或者是抑制电信号,显然我们不能称单个脑细胞具有智能,只有其组成一个整体之后我们才能够将其系统考虑。同样,书中薛定谔也表示不赞成该观点:
接着,薛定谔针对中文房间提出了“发光屋子”的实验,假设有个人在黑暗屋子里上下移动一块磁铁,那么按照麦克斯韦理论,会产生一圈一圈的电磁波,在某种程度上“照亮”这个屋子(光也是电磁波),由于人类无法观测到可见光之外的光,所以很难接受屋子被照亮,因为就直觉来说接受”光和电磁波是相同的物理现象”非常困难,那么接受“符合操作可以产生意义”(至少是产生同样符合逻辑的符号序列)也将是困难的,但是我们无法说这是错误的。
从第五章开始,辩论开始变得模糊而难以捉摸,思考的边界也不断被扩大,这时语言作为智能重要的体现被作为双方都力图占领的高地。
在语言能力的形成上,图灵提出一种假设,所有语言都有一种共同的深层结构,或者说是“普适语法”,人脑天然就带有这种“模板”,而在后天自然语言环境的刺激下,不断激发填充这些模板,最终形成语言能力。另一方的意见则在于语言的本质要素在于意义,将实指和符号相关联。但是双方都同意语言在构建人工智能(或者不能构建)上的重要性,并且社会语言获得的不可或缺的要素。
所以说NLP永远是AI届的一个重要研究要素,但是就目前看来,NLP的研究离涉及到真正的智能还有很长一段距离,不管是理解还是生成上。在“模板”这一方面,不由得就想起神经网络来,这里的网络结构就对应模板,而后天的刺激对应数据集的训练,最终形成的语言能力也就是训练好的模型,这个角度来看,二者是多么相似啊。
接下来的讨论涉及到生命和个性,社会行为,文化等等,但都是细枝末节的一些讨论了。总结来看:
图灵对思维机器包含着信息和热情,维特根斯坦认为这个问题本身就没有意义:思维和语言相关,语言又是人类生活的产物,无论机器何等聪明,都不能共享人类的这种生活,也就谈不上智能。
全书看完,还是能够给我不少启发和思考的。在1956年达特茅斯会议后,人工智能这一概念被正式确定,该会议上提出的人工智能的两个经典问题上:对弈和翻译。对弈方面,即使在难度极高的围棋上,机器也已经大大甩开人类了;而在翻译方面,基于NN的方法使得翻译的正确率有了质的提高,并在某些语言对上达到了近似人类的水平。
虽然人工智能的实现比我们想象的困难许多,但是其进展也超出我们的预期。最终人类和机器是否会分道扬镳,再有50年也许就能品尝到这场盛宴的餐后甜点,或是,看到另一个时代的晨曦?