关于图灵机的三个问题

写这篇文章,是想尝试回答学习图灵机模型中遇到的三个问题:

  1. 为什么图灵机有不可判的问题?
  2. 为什么强大的图灵机会不停机?
  3. 为什么图灵当初要设计图灵机?

图灵机(Turing machine)是英国数学家阿兰·图灵(Alan Turing)于1936年设计的一种抽象机器,用于定义和模拟计算(computing)。图灵机虽然构造简单,但却及其强大,它能模拟现代计算机的所有计算行为,堪称计算的终极机器。然而即便是这个终极机器,也有令它无能为力的问题,这便是第一个要回答的问题:为什么图灵机有不可判的问题?

首先明确什么是图灵可识别(Turing recognizable)和图灵可判定(Turing decidable)。图灵机的识别对象是语言,图灵可识别当然不是说图灵本人能识别的语言(照这样说汉语可能是图灵不可识别的~),事实上这只是简称,全称应该是图灵机可识别语言(Turing machine recognizable language)和图灵机可判定语言(Turing machine decidable language)。

一台图灵机在读取一个串后可能进入三种状态:接受、拒绝、循环,如果图灵机进入循环状态,那它将永不停机。现在假设有语言A,如果能设计出一台图灵机M,对于任意字符串ω,如果ω∈A,那么M读取ω后会进入接受状态,那么A是一个图灵可识别语言。注意这个定义对于ω不属于A的情况没有做出限制,所以M读取到不属于A的ω,那么它有可能拒绝,也有可能循环。

图灵可判定语言的要求更严格,它要求对于语言A能设计出一台图灵机M:如果ω∈A,M进入接受状态;否则进入拒绝状态。如果一个语言是图灵可判定的,总能设计出一台图灵机,能在有限步数内判定一个字符串是不是属于这个语言。如果一台图灵机对所有输入总是停机,那么称它为判定器(decider)。然而第一个问题指明一定有所有判定器都不能判定的问题,要证明这一点,得从康托(Georg Cantor)说起。

康托最大的贡献可能是创建了现代集合论,他认为某些不同的无穷集合有不同的大小。1891年,康托发表了一篇只有5页的论文,证明实数集的基数大于自然数集,并在这篇论文中提出了传说中的对角线方法(方法虽然巧妙但很简单,wiki上有我就不赘述)。图灵机的不可判定问题便需要借助对角线方法。而实数集「大于」自然数集这个事实,可以这么想:「无限×无限」比「无限×有限」大。每个自然数是有限的,集合是一阶无限,自然数集就是一阶无限;相较之下,一个实数是一阶无限,集合又是一阶无限,那么实数的集合就是二阶无限。这个一阶二阶只是我个人的说法,关于不同集合之间的大小关系,康托提出连续统假设,即希尔伯特第一问题,认为不存在一个基数绝对大于可数集而绝对小于实数集的集合,不过这跟今天的话题没有关系,不再展开。

回到正题:图灵机。图灵机能够识别语言,而图灵机本身当然也可以由语言描述。什么是语言?给定一个字母表∑,一个{[由∑中的字母组成的序列]的集合}就是∑上的一个语言(为了消除歧义,算式可以加括号,语言当然也可以)。必须清楚这些概念中哪些是有限的,哪些是无限的:一个语言包含的字符串数可以是有限的也可以是无限的,但一个字母表上的所有语言的数目是无限的,而语言中任意一个字符串的长度是有限的。

首先要证明的是:一个字母表上所有语言构成的集合不仅是无限的,而且是不可数的。

这里需要借助无限二进制序列的集合来帮助证明。一个无限二进制序列(即{0,1}组成的无限序列)是一阶无限,那么这些序列组成的集合就是「无限×无限」,可以通过对角线方法证明无限二进制序列是不可数的,也可以将实数集的元素唯一地映射到无限二进制序列集合。用后者的方法,可以这样建立二者之间的映射:二进制序列每4个为一组,用8421BCD码编码,4位对应实数中的一位,再用1111表示小数点,这样每个实数总能映射到一个唯一的二进制序列,既然实数集不可数,那么无限二进制序列也不可数。

接下来证明,{无限二进制序列的集合B}与(任意字母表){∑上的所有语言组成的集合L}是同样规模的,仍然通过建立映射的方法。设∑上所有字符串的集合按字典序排序成∑*={s1, s2, s3, …},L中的每个语言A都对应一个二进制序列b:如果si∈A,bi=1;否则bi=0,这样的序列称作A的特征序列。举个例子,如果∑={a,b},A是所有包含b的串构成的语言,则A的特征序列b如下:

1
2
3
∑*={a, b, aa, ab, ba, bb, aaa, aab,...}
A ={ b, ab, ba, bb, aab,...}
b = 0 1 0 1 1 1 0 1 ,...

反之,每个二进制序列b也能对应一个唯一的语言,所以L与B等势,又因为B是不可数集,所以{∑上的所有语言组成的集合L}也是不可数的。

好,明确了所有语言构成的集合是不可数的之后,我要回答下面这个问题:为什么图灵机集合是可数的?(reserve:哥德尔配数法)

从图灵机的定义入手,图灵机是1个7元组(Q,∑,Γ,δ,q0,qaccept,qreject)。每一台图灵机总是由有限个字符编码而成:

  1. 有限的状态集Q。

  2. 有限的输入字母表∑。

  3. 有限的带字母表Γ。

  4. 有限的转换函数δ。

  5. 1个起始状态q0。

  6. 有限个接受状态qaccept。

  7. 有限个拒绝状态qreject。

若上述每个元素都用二进制编码表示,任意一台图灵机都只需要有限个二进制位。再将这些二进制串按照字典序排列,就可以得到一个{图灵机集合}->自然数集的一一对应。

好,给定一个字母表∑:

[∑上的所有语言]的集合<=>[二进制无限序列]的集合<=>实数集<=>不可数集

[所有图灵机]的集合<=>自然数集<=>可数集

有不可数个语言,却只有可数个图灵机,语言的集合「大于」图灵机的集合,所以从本质上证明了必然存在图灵机不能识别的语言。

推论:必然存在图灵机不能判定的语言。理由是图灵可判定语言的集合不会大于图灵可识别语言。

图灵可判定语言要求更严格,所以应该存在这样的语言:它是图灵可识别的,但同时不是图灵可判定的。事实确实如此,图灵自己就给出了一个:

A={<M, ω> | M描述一台图灵机,且M描述的机器接受ω}

首先证明A是图灵可识别的(形式化证明太过繁琐,这里只给出很高层次的证明)。设通用图灵机U这样运行:U接受参数<M, ω>,它可根据图灵机M的描述模拟M的行为,并在虚拟的M上计算ω。如果M接受ω,那么U进入接受状态;否则拒绝。

依据定义以及通用图灵机的存在性,U能识别A,所以A是图灵可识别的。

证毕。

顺着这个证明走下去,如果M本身遇到输入ω时会陷入循环,那么模拟M的U也会陷入循环,所以U不是判定器。如果U知道M在ω上不停机,那么它可以进入拒绝状态,问题是它不知道。那么能判定A的图灵机存在吗?我们就假设存在H,使得:

1)若M接受ω,则H(<M,ω>) =接受

2)若M不接受ω,则H(<M,ω>) =拒绝

根据H的定义,无论M接不接受ω,H总能停机。进一步再假设有图灵机D,以H为子程序,接受一个描述图灵机的串,在H上运行H(<M,>),并返回相反的结果:

1)若H(<M,>)=接受,则D()=拒绝

2)若H(<M,>) =拒绝,则D()=接受

也就是说,如果一台图灵机M接受描述它自身的串,那么D()进入拒绝状态。构造这样一台奇怪的D是为了让它做下面这件事情,现在对D输入描述它自己的串,看看会发生什么:

1)若D接受,即H(<D,>)=接受,则D()=拒绝

2)若D拒绝,即H(<D,>) =拒绝,则D()=接受

到底是接受还是拒绝呢?兜了一个圈子,D绕回原地,产生了矛盾。所以D是不存在的,所以H也是不存在的,语言A不可判定。

证毕。

上述证明比较绕,我用一阶逻辑再改写一遍。

命题:

1)P:存在语言A的判定器H

2)Q:存在以H为子程序的图灵机D(描述见上)

已知条件:

1)P→Q:如果有H,总能设计出D

2)┐Q:D是不存在的(证明见上)

证明:

1 P 假设

2 P→Q 已知条件

3 Q 1,2

4 ┐Q 已知条件

5 ┴ 推出矛盾

6 ┐P 假设不成立

上面的证明中,图灵机D的构造简直是神来之笔,图灵怎么想到的?虽然之前的证明没有直接给出不可判定的语言,但已经从数量上证明有图灵机不能判定的语言,由于判定器的要求更严格,所以可以推断所有判定器构成的集合小于所有语言构成的集合。这是个与「实数集的势大于自然数集」类似的命题,所以应该能用类似的方法——对角线方法证明。好,尝试一下。

康托构造映射表格时,表格的每一行由一个自然数表示这是第几行,每一列也由一个自然数标识列数,对角线法构造出来的实数实际上是一行,然而这一行却和每一行都不一样。刚才的证明我们看到,图灵机集合是可数集,可将其对应自然数,标识表格的每一行,那么每一列用什么标识呢?怎样让列数与行数相等呢?行和列的交叉处是什么呢?自然数/实数的例子中,每一行由一个自然数对应一个实数,在这个问题中,行由图灵机标识了,那么不难想到,每一行应该是一个语言。语言又该如何表示?下面依次回答这些问题。

列应该用什么来标识?在对角线方法中,表格的行列数一致,行和列都用自然数集标识。那么首先可以想到既然行用图灵机标识,那么列也可以用图灵机标识。但是这样的话行列交汇处就没什么意义了,试问随意挑选的两台图灵机之间能擦出什么火花?

脑子再转一下,图灵机与图灵机之间没有什么一般化的关系,图灵机识别的是语言,是字符串,那么将标识列的图灵机换成描述图灵机的串,既保持了行列数一致性,又让行列交汇处有了非平凡的意义!即,用M1, M2, M3…标识第1行、第2行、第3行……再用描述图灵机的字符串, , …标识第1列、第2列、第3列……行列交汇处就填入accept或reject,表示一台图灵机是否接受描述某一台图灵机的串!这样,每一行刚好也就是一个语言,每一个部分的意义都正好是我们想要的。

走到这一步,离结果就很近了。

若将所有图灵机和描述它们的串排成表,行列交叉处就是H(Mi,)的运行结果。构造图灵机D,实际上就是用对角线方法选出一行,这一行的第1列与M1相反,第2列与M2相反,第3列与M3相反……所以构造出来的这一行肯定不在这个表中。如果在,这么D所在的行与对角线相交处会出现矛盾!

想必图灵深知语言集比图灵机集要「大」,一台图灵机只能对应一个语言,所以用对角线方法必定能构造出一个所有图灵机都不能识别的语言。这个语言就是D「识别」的语言,则D的语言肯定不会出现在那个图灵机和对应语言的表格中。如果强行将这台「不存在的图灵机」安插进表格中,必然产生矛盾,矛盾就发生在D所在行与对角线的相交处。就像康托用对角线方法构造出来的那个实数无法插入到[自然数->实数]的映射表格中,否则构造出来的那个实数就与它自己矛盾了,神奇的「图灵机D」就是这么来的。

图灵是用图灵机的术语改写了对角线方法,在图灵机上重现康托的思想。

至此,回答了第一个问题:为什么图灵机也有不可判定的语言,并且还构造了一个这样的语言,即A={<M, ω> | M描述一台图灵机,且M描述的机器接受ω},A又被称为接受问题。

语言A是超越图灵机极限的必然产物,因为图灵机和语言的内在关系决定了A这样不能被任何图灵机判定的语言是存在的。这是本质上的原因,但关于A本身还有一个表象上的原因(之前提到过):之所以不能用图灵机断定其它图灵机是否接受一个串,是因为图灵机不能断定其它图灵机在某个输入串上计算时是否会停机,这个问题同样是不可判定的,这就是著名的停机问题(Halting problem)。庄子曰,「吾生也有涯,而知也无涯,以有涯随无涯,殆已」。以有限的步骤去判定可能无限的计算,殆已。

但由此我产生了一个很大的疑问:为什么图灵机会不停机?这也是我试图回答的第二个问题。

图灵机虽然强大,但是不停机的缺陷是人们万万不想要的。然而这缺陷是天生的,原因是……图灵赋予图灵机两个无限:

1)图灵机能在输入字符串上左右移动,步骤无限,时间无限。

2)图灵机有一条无限长的带子,供读写头在上面活动,空间无限。

有穷状态机和下推自动机这两种更简单能力更弱的机器只能看到极其有限的历史,它们的读写头只能在输入字符串上单向移动,所以肯定会停机。而图灵机的读写头却可以在输入串上左右移动……一旦拥有这个能力,图灵机可以看到更多的历史,同时就必须承担这种能力带来的风险——无限循环。另一方面,图灵机拥有无限长的带子,给读写头的移动提供了无限的空间,更增加了循环的可能。

实际计算机没有无限长的带子,只有有限的内存,所以读写头左右移动这种能力带来的影响更致命:即使只有有限的空间,也可能陷入无限的循环。

然而很遗憾我的尝试只能到此为止了,现在的我还不能从本质上回答「为什么不停机」。根据我的理解,图灵机会不停机与哥德尔不完备定理有关。应该是图灵机这两种能力(左右移动,无限带子)让它足以蕴含皮亚诺算术公理,同时引入了既不能证明也不能证否的命题:碰到这种情况,图灵机就陷入循环了。希望自己将来能够摸清背后的本质,完整地回答为什么强大的图灵机会不停机?

既然图灵机有这么大的缺陷,为什么图灵当初还要设计图灵机?这要从上个世纪初数学界的boss希尔伯特(David Hilbert)说起。1928年,希尔伯特在国际数学家大会上很乐观地预期,数学将在不久的将来建立在牢固的基础上,并提出关于一阶逻辑公式可满足性的判定问题(Entscheidungs Problem)。引用我以前写过的一段话:

希尔伯特计划把数学建立在一个完备的、一致的公理化系统之上。如果他成功了,这意味着:

一,所有的数学命题都能用符号无二义地表达出来;

二,所有的数学命题都能被证明或证伪(完备性);

三,对任意数学命题P,如果P被证明,那么¬P必定能被证伪(一致性)。

四,如果最后再找到一个算法,能机械地判定一个数学命题的真伪(可判定性),那么整个数学大厦就是钢筋铁骨屹立不倒了。

结果事与愿违。

1931年,哥德尔(Kurt Gödel)发表了震惊数学界的哥德尔不完备定理,数学系统一致性和完备性的统一被打破。

1935-1936年间,图灵在剑桥大学国王学院研究希尔伯特判定问题。1936年5月,图灵完成论文《论可计算数及其在判定问题上的应用》(”On Computable Numbers, with an Application to the Entscheidungsproblem”),提出图灵机作为通用计算模型,并基于图灵机重新定义了可计算函数,同时给出了一个图灵机无法判定的问题,即停机问题。

1937-1938年间,图灵来到普林斯顿大学,在逻辑大神阿隆佐·邱奇的指导下继续研究可计算性问题,这一阶段他证明他的图灵机与邱奇的λ演算具有等价的计算能力,并将这个结果作为附录加到他的论文当中。而此前,哥德尔也提出了递归函数作为计算模型,不过同样不久后被证明与λ演算等价。

在这一期间,邱奇-图灵论题(Church-Turing Thesis)在邱奇、图灵与哥德尔三人的工作下成型,该论题认为所有可有效计算的函数或算法都可以由一台图灵机来执行。这是一个论题,而不是命题,因为「可有效计算」本身是一个不存在精确定义的概念。目前普遍认为邱奇-图灵论题是正确的,即所有人能想到的算法都能用图灵机执行。

图灵设计了一个能模拟所有计算的机器,然后证明这台机器也有缺陷,有它不可判定的问题,给希尔伯特的幻想以最后的致命一击,这便是图灵机的起源。毫无疑问,虽然没有直接参与图灵机的设计,但希尔伯特功不可没,因他提出的问题指引了其他数学家的工作。

图灵机给计算机的具体实现提供了参考价值,但它速度太慢,也很难编程。相比之下它更是数学家们的神兵利器:算法问题从此有了坚实的基础。但图灵机也给出了现在这个时代人的上限,而这个「人」还不是一般人,而是人类中思考的精英——数学家。

根据邱奇-图灵论题,图灵机能模拟所有机械的、有限步的计算,但仍然有图灵机不能识别的语言,它的诞生就是为了去证明它自己的缺陷……这就是为什么说:

计算机是数学家一次思考失败的产物。

最后,谨以此文献给因社会不公而英年早逝的天才——Alan Mathison Turing

关于图灵机的三个问题

The Why·Liam·Blog by WhyLiam is licensed under a Creative Commons BY-NC-ND 4.0 International License.

WhyLiam创作并维护的Why·Liam·Blog采用创作共用保留署名-非商业-禁止演绎4.0国际许可证

本文首发于Why·Liam·Blog (https://blog.naaln.com),版权所有,侵权必究。

本文永久链接:https://blog.naaln.com/2013/04/on-three-problems-of-turing-machines/