图灵:计算机器与智能经典AI论文系列

经典AI论文这个系列的产生主要是出于这样一个想法: 现在每年人工智能相关的顶会文章, 一年下来都有上万篇, 论文似乎永远都读不完. 然而, 这些论文真正的价值有多少呢? 有多少论文在十年之后还能发挥作用了? 我们真的需要一个会议就涌现出成百上千个state of art的模型吗?
不妨来看看这些历久弥新的经典AI论文, 也许这些论文没有最新的技术, 也许里面的有些观点现在来看都很幼稚, 但是他们也曾经发挥过巨大的作用. 重温这些”老论文”, 也许能够给我们带来更开阔的视野. 不要总是被近五年(甚至很多人觉得两年前的文章就过时了)的走势所裹挟, 也许我们应该像诗人Robert Frost说的那样, took the one less traveled by.

这次来读的是祖师爷A.M.图灵在1950年发表的一篇论文: Computing Machinery and Intelligence (计算机器与智能).

在这篇论文里, 图灵首先是提出了一个问题: “机器能思考吗?(Can machines think)”, 接着设计了一个游戏, 并认为该游戏是对前问题的等价描述. 这里提出的”模仿游戏(Imitation Game)”后来被称为图灵测试, 在很长一段时间内, 这一测试都是较为公认的人工智能判断标准.
在提出该测试之后, 图灵给出了对该测试的必要辩护, 并阐明了测试使用的机器. 接着, 他对反对”机器具有思维”的几种观点做了回应, 最后描述了一种可能解决机器思维的模型即”学习机”.

模仿游戏

作者开宗明义的提出了问题: 机器能思考吗? 当然根据常规思想来看, 我们得从”机器”和”思考”的定义来看, 但是很难找到对二者没有歧义的准确定义, 而且这样的讨论往往会变得荒唐. 于是作者提出了另一个与之密切相关的问题来代替这个问题.
这个新的问题可以总结为: 是否可能存在一种可构想的计算机能够表演”模仿游戏”, 该计算机能以无法与人类回答相区别的方式来回答提问者的问题.

在图灵看来,问答法适合于引入任何一个我们希望设计的人类需要花费心力的领域, 虽然机器想模仿人类时很多时候需要做出拙劣的表现(例如故意拖延做运算的时间)这显得很愚蠢, 但是不可否认当机器能够识别出需要显得愚蠢的场景本身就需要一定智能.

最终, 图灵认为, 这样的一个模仿游戏能够恰如其分的测试出机器的智能.

机器

接着图灵讨论了待测试的机器, 并指定其为”数字计算机”并将其抽象为离散状态机. 机器的内部状态会随着信号的输入而改变, 并可能有着相应的输出. 对于一个确定的离散状态机, 一旦确定了机器的初始状态和输入信号序列, 就可以预见未来所有的状态. 这个机器可看作是为了便于实现而去掉偶然性的一种机械决定论指导下的机器, 它具有能够模拟任何离散状态的特殊性能.
将讨论中对机器的共识局限在这样一个机器上之后, 原问题就可以用一种等价的方式描述:

我们只讨论一台特定的数字计算机C, 如果经过改进, 使得这台计算机具备合乎要求的存储, 动作速度也相应提高, 同时还为它提供了恰当的程序, 那么在模拟游戏中, 由人担任B的角色, C就能够令人满意地扮演A的角色, 这有可能成为事实吗?

谁反对?

在上一节后, 讨论的内容逐渐清晰了. 在这一节, 图灵对几种主要的反对意见一一做了回应:

神学反对意见: 上帝把不朽的灵魂给了每个男人和女人, 而没有给任何其他动物和机器, 所以动物和机器都不能思维.

…至于神学论点, 无论他们可以用来支持什么, 都不会给我留下深刻印象. … 从今天的知识看来, 这样的论点毫无价值.

“鸵鸟”意见: “机器思维的后果太可怕了, 我们希望并且相信机器做不到这一点.”

如果能够证明人类必然优越, 那是再好不过的, 这样人类就没有失去其居高临下地位的危险…我认为这个论点没有多大价值, 不值一驳.

数学反对意见: 数理逻辑的许多结果证明: 离散状态机的能力是有限度的.

虽然已经证明了任何一台机器能力有限, 但是没有证明机器能够达到的有限度的能力适用于人工智能的实现.

有关意识的反对意见: 杰弗逊教授在1949年提出了这个论点, 简单概括出来就是, 要称机器具有人工智能, 机器必须做到有思想, 懂感情. 例如创作协奏曲并不能代表机器有智能, 机器得知道/感觉到它已经写出了协奏曲, 需要能感受到成功的喜悦.

从这个观点的最极端形式来看, 确认一台机器是否能思维的唯一方法, 就是变成这台机器, 并感受到自己在思维, 然后公布于世. 根据这一观点, 得知一个人会思维的唯一方法, 就是编程这个特定的人. 这实际上是唯我论的观点.

注: 杰佛逊教授提出的写十四行诗, 创作协奏曲等等, 现在都已经有相应的机器学习算法能够实现了.

有关能力缺陷的论点: 就算你能够让一台机器完成你所提到的那些事情, 它也不可能做到X. X可以是: 仁慈, 机智, 漂亮, 友好, 爱吃草莓冰淇淋, 会坠入情网等等等等.

那种批评机器不可能有丰富多彩行为的说法, 等于在说机器不可能有丰富的存储容量. 直至最近, 甚至一千个数字的存储容量还是很罕见.

注: 想想看我们现在的存储设备能容纳多少数字了.

洛夫莱斯夫人的反对意见: 分析机无权说它创造出什么新的东西, 它所能做的都是 那些我们知道怎样命令它去执行的事情.

这并不表明, 没有可能建造这样一台机器, 它会”为自己着想”, 或者用生物术语说, 人们能在她内部建立条件反射, 以此作为学习的基础. …… 机器不可能让人出乎意料的观点起因于哲学家和数学家们特别容易持有的一个谬见. 它假定: 一旦事实呈现于心灵, 这个事实的全部后果就会与之同时涌入心灵之中.

有关神经系统连续性的观点: 由于人的神经系统不是离散状态机, 所以离散状态机无法模拟神经系统的行为.

诚然,离散状态机不同于连续机. 但是这种不同不妨碍问题正面命题的实现. 例如微分分析机这种连续机可以用离散状态机来逼近.

学习机

在上一节图灵舌战群儒之后, 图灵却”认怂”了. 他表示无法从肯定的角度来作出非常有说服力的论证来支持自己的观点(如果能拿出的话, 他就不用这样煞费苦心地列举反面观点中的错误了).

不过他还是给出了自己的一些想法. 对于一个成人心灵的模仿, 他将这个心灵的状态拆解为三个部分:

心灵的初始状态, 例如出生时的状态.
所受教育.
教育之外的其他经验.

从常识来说, 儿童的心灵状态比成人更容易实现, 它的机制更少一些. 而2,3点其实可以合并为广义的教育过程. 那么任务就分为两部分: 儿童心灵程序和教育过程.

对于前一部分, 儿童机的结构可以看做生物中的遗传素质, 儿童机的变化看做是突变, 实验者的判断来充当自然选择.

而对于后一部分, 图灵表示可以讲奖惩和教育过程结合起来, 并辅以一定的非情感沟通方式.

学习机的一个重要特征是, 它的教师对于它的内部过程是怎样的, 往往知之甚少, 尽管他在一定程度上能够预言他学生的行为. (这一特性有没有一点像现在黑箱的深度学习?)

可以看出, 图灵的构想中, 前一部分有些遗传算法, 演化学习的内核, 后一部分则有一点强化学习的雏形.

对于人工智能在哪里起步, 他给出两个方向, 一个是非常抽象的活动, 例如下棋(这一点已经基本上被攻克了), 另一个方向可以试试看给机器配备好各类先进的传感器, 然后像教孩子一样教他学英语(指着东西说出它的名字).

最后, 图灵有如下寄语与君共勉:

我们的目光所及, 只能在不远的前方, 但是可以看到, 那里有大量需要去做的工作.