导语
“意识到底是如何产生的?能通过技术手段进行读取吗?”关于这个问题,作者更多地会展示各种主流理论,而非给出一个答案。
研究领域:意识科学,自指,整合信息论
章彦博
作者
邓一雪
编辑
与其他几位朋友的回答不同,我更多的会展示各种主流理论,而非给出一个答案。
关于意识的研究,传统上常常研究意识与大脑活动的相关性。例如,比较一个人清醒和昏迷时大脑活动的差别。但是,这种研究无法区分因果——这些活动是产生意识的原因,还是产生意识的结果?
因此,近年来有一批「意识理论」涌现出来。与传统方法不同,意识理论直接从理论出发,给出意识出现的条件,或者意识的定义。他们主要想解决两个问题(或者之一):如何判断意识的有无;以及区分意识状态之间的差别。
近日NatureNeuroscience发表了一篇综述[1],比较全面地概览了各种意识理论。本文也会按照篇文章的分类,大体介绍四种意识理论:更高层次理论(Higher-ordertheory),全局工作空间理论(Globalworkspacetheories),整合信息论(Integratedinformationtheory),以及再入与预测加工理论(Re-entryandpredictiveprocessingtheories)。这几个理论中,我比较熟悉的只有整合信息论,所以会相对多介绍一点它的细节,以及个人的评价。
1.难问题
意识是一个困难的问题,事实上,哲学中直接就有一个专门的词:「意识的难题」(Hardproblemofconsciousness)。在年,微积分的发明者之一——莱布尼兹出版了他的哲学著作《单子论》(LaMonadologie),其中提到了一个思想实验:
必须承认,仅仅靠机械的运动、数值,是无法解释知觉的存在的。想象一个机械装置,我们不知它有无知觉。因此,我们将自己缩小,走进其中,可以看清机器运行的所有细节、过程,也可以理解过程背后的力学原理。甚至,我们还能预测机械将如何运转。
然而,这一切似乎都与这机器的知觉无关。观测到的现象,与知觉之间,似乎总有一个天堑一般,总是无法相互勾连。
这便是「莱布尼兹之堑」(Leibnizsgap)。开篇时我曾说道,「我更多地会展示各种主流理论,而非给出一个答案」。为什么不给出答案呢,就是因为这个问题太过困难,以至于目前还没有一个定论。按照莱布尼兹的思想实验,想要知道一个系统是否有意识,就得成为那个系统。
似乎无解。
2.分类
对付这类看似无解的问题,我们常用的一个手段就是分类:把问题拆分,看看哪部分是可以解决的、哪部分是难以解决的,以及哪部分是不可能解决的。
意识虽然整体上是一个困难的问题,但其中仍然可以进一步划分。关于意识相关的功能、行为,是比较简单的部分;而关于体验、经验这类主观判断的部分,则是困难的部分。举例来说,全局工作空间理论(GWT)主要是将「存在一个公共记忆空间」和意识联系起来了。而整合信息论则讨论了不同体验的差别在哪里。
3.更高层次理论
更高层次理论(Higher-ordertheory[2])认为,如果一个精神状态被其表示所指代,这个精神状态就是有意识的。举例来说,如果我现在看着手机屏幕,我的视觉区会有屏幕的低层次特征(形状、颜色)。而我的前额叶则会有更高层次的表征,例如「手机」这个词汇,它不光指向物理上的手机,也指向了我视觉区的那些特征。那么,前额叶中「手机的概念」,就是低层次特征的「抽象表示态」(meta-representationalstate)。用论文中的图示,就是下面这个样子的:
在这种「指向」的过程中,有一种特殊的情形,就是自指:自己指向自己。看起来非常玄学,但我们每天都会这么做。例如,我现在就知道我在写文章。那么,具体的「写文章」是一个状态,它涉及了具体的词句,但是,「写文章」这个词又指向了写文章这件事。这就是一种自指。
更高层次理论似乎没有进一步探讨意识产生的具体物理过程,特别是微观层面的物理过程。事实上,目前主流的意识理论都没有讨论这个问题。
我知道会有人用安德森的名言「Moreisdifferent」[3]为此辩护。但若细究安德森的论文,其中所说的其实是:
微观规则的对称性,不一定会体现在宏观层面上。
而微观上如果不存在意识,很难用Moreisdifferent的说辞去辩护——这完全就是无中生有。复杂系统的「涌现」常常看起来也像是无中生有,但这基本都是因为我们无法理解大规模物体的复杂运动导致的——我们不理解的,便称之为「无」,然后说「无中生有」。
但遗憾的是,目前我们可能必须要忍受这种割裂。其实莱布尼兹也已经用他的「莱布尼兹之堑」表达了类似的观点。在这里,这个问题就此打住,后文之中也将此暂时悬置不论。
4.全局工作间理论
全局工作空间理论也是类似的路径——有此功能,有此过程,便有意识。全局工作空间理论认为,意识来自于那些全局可用的认知过程。我们可以拿「注意力」来举例:
全局工作空间理论认为,注意力在选择并放大特定的信号[4],并让其进入全局工作空间。这样就可以调动全脑的功能,来处理一件任务。因此,我们注意的东西,常常就是我们意识到的东西。
全局工作空间认为负责这部分任务的脑区在顶额叶,也有实验表明,顶额叶如果受损,会导致全局的意识丧失。
全局工作空间理论的关键在于「全局」。如何定义全局?是根据对象、数量,还是根据信息如何广播出去的?这些问题仍然存在争论。就如我在开头所说,现在还难以给出「意识是什么」的答案。
5.再入与预测加工理论
关于意识的实验,有一个非常著名的「双眼竞争实验」:给左右眼看到不同的画面(例如左眼看到房子,右眼看到钢笔),我们可以通过自己的意念,「让」自己稳定地感受到不同的东西。
这种控制是如何产生的?我们的体验又是如何变得稳定的(不会轻易地跳到另一个感受上)。预测加工理论给出了解释:大脑中不光存在自下而上的过程,还存在自上而下的过程。拿视觉为例,自下而上就是从视神经开始,逐渐把信号抽象,变成概念;自上而下则是相反:大脑在预测之后的输入,并试图降低预测的误差,是一种再入。
回到「双眼竞争实验」,当我决定我看到的是房子的时候,右眼看到的钢笔就变成了误差,是需要被消除的。由此,我的决定(预测)影响了我的感知,并压制了钢笔的信号。
预测加工理论并非为意识而生,但却能解释很多意识现象。与此同时,它甚至能和机器学习联系起来,例如可以解释学习过程[5],或是与梯度下降联系起来[6]。进一步地,如果这种自顶向下的预测存在延时、或者存在循环,就会出现「预测下一时刻的自己」的问题——自指产生了,「更高层次」也产生了,这样就和「更高层次理论」联系了起来。
6.整合信息论
整合信息论[7]与前面的几个理论都不一样,他的野心非常大:他试图从公理出发,像几何学一样,推演出意识理论的大厦。初读到这里时,我简直像是发现了一个宝藏。然而,我对其了解的越多,失望也就越多。
整合信息论提出了四大公理[8]:
1.真实:意识体验是真实的;
2.信息:意识是包含信息的。即便闭上眼睛,什么也看不到,这份黑暗仍然是包含信息的——因为它排除了其他的可能性;
3.整合:意识是整合的,是一体的,是不可拆分的。例如,「看到桌子上的苹果的体验」不等于「看到桌子的体验」+「看到苹果的体验」;也不等于画面左边的体验+画面右边的体验。
4.独一:任意时刻,我们的意识只有一个。不会存在两个意识共存、叠加的情况。
这几个公理中,最重要的就是信息和整合两个部分。
先暂时不谈信息,要度量整合,一个非常聪明的办法就是将系统切割。如果能找到一种切割方式,使得系统不受任何影响,那这个系统就是不整合的。举个例子,找到两个陌生人,在它们之间的空气中切割一刀,两个人受到的影响几乎忽略不计。因此两人是不整合的。而如果在情侣之间切割,可以想见,其受到的影响会稍微大一点,但这种影响仍然比不上对人脑的任意切割。
因此,整合信息论所能包含的系统非常广泛。不只是生物系统,一个ETC闸门也是有微弱意识的——将传感器与闸门切割,它的因果信息会受到损失。在各种不同的切割中,最小的损失也是大于零的。因此,整合信息论认为:ETC闸门也是有意识的。
整合信息论用一个符号Φ代表系统的整合信息,论文中虽然没有明说,但是却在处处暗示:Φ就是在度量意识水平。整合信息论的结构极为繁复,如果总结出一个公式,就是下面的样子:
找到一个切割方式c,使得被切割之后的系统sc所损失的信息最小。
而在这里,他们专门开发了一种新的信息度量方法:因果信息。在IIT2.0之前,因果信息的度量非常优雅——使用因果科学中的do操作,计算「已知一个状态」和「不知此状态」导致的分布差异的K-L散度。这种度量可以看作一种特殊的互信息,即状态转移矩阵的互信息(而非联合分布的互信息)。
有意思的是,在IIT3.0之中,它们将K-L散度换成了modifiedearthmoverdistance,即修改过了的推土距离。且不说这里的修改是否合适,这里已经暴露出了整合信息论的一个弱点:它并非如几何学那般精密。从公理得到的理论,也并非浑然天成,而是处处彰显着理论提出者自己的意愿。
拥有个人风格并非坏事,但缺乏限制常常带来问题。一个常见的后果,就是在数学上不自洽。在IIT3.0理论中,有一步会要选择一个信息损失最小化的切割(独一性公理)。但IIT理论没有回答如果存在多个损失一致情形下的解决方案。事实上,如果去看他们的代码[9],就会发现这一步是完全随机的[10][11]。而不同的选择,得到的Φ天差地别。
另一个问题则是IIT研究的尺度:计算Phi的尺度到底是神经级别,还是脑区级别,或者,更为极端地,原子级别?这是一个非常重要的问题,因为这涉及到实验——IIT的实验只考虑了脑区级别的模型,但他们没有论证这里的粗粒化方法是否合理,因此,IIT得到的一个重要结论:意识起源于小脑,也是值得怀疑的。
这些当然不能判IIT死刑,因为他的公理基础仍然是比较牢固的。但是,他们至少也应该后退几步,向着公理体系这一原点后退几步,尝试使用更严谨的数学。
另一个比较偏个人的吐槽,是计算Φ巨大的时间复杂度。我自己的估算,其复杂度大概是O(N!)级别,一个系统大小超过10,基本就没法计算了。一方面,这是技术上的困难——人脑的神经元远远大于10;另一方面,我认为也是科学上的问题:如果计算它所需要的时间如此巨大,那我们还能确认自己有意识吗?意识需要通过这种繁复的运算才能被感知到吗?
7.「哲学僵尸」与目的论
回到闸门的例子上,一个简洁的闸门,可以画成这样的电路图[10]:
在这个结构中,系统的不同状态都有比较高的Φ,换句话说,整合信息论认为它具有意识。
然而,如果我们把电路做一些修改,保持原先的功能不变,变成这样:
得到的Φ就全都是0了——它没有意识。
这是非常有意思的现象:即便功能一样,不同的物理结构,就会带来不同的意识水平。按照IIT理论,前馈神经网络的Φ=0,而RNN则大于零。关键在于是否存在回路(这一点与再入理论很像,但这是IIT理论的推论,而非出发点)。
「ETC闸门有意识」并不是一个笑话,同样地,「保持功能不变,更改一下物理结构,意识就消失了」,在我看来也不是一个需要嘲笑的东西。但它引出了一个重要的问题:我们为何进化出了意识?
要探讨这个问题,我们需要了解「哲学僵尸」的概念:
哲学僵尸(英语:Philosophicalzombie,或称p-zombie),又译哲学丧尸,是精神哲学上的假设存在物。假设这个世界上存在一种人,外观与物理组成都与一般人类无异,但是他没有意识经验、感质或感情。举例而言,哲学僵尸在撞上尖锐物品时,在外在上与一般正常人类相同,可以看到他的皮肤出现伤口,测量他的神经讯号,也可以测量到疼痛讯号的出现,会出现疼痛的表情,发出叫声,会向其他人表示自己正在疼痛。但是他的内在心灵中,没有疼痛的意识。
简单来说,哲学僵尸的外表与人无异,但却没有意识(哲学僵尸可以通过镜子实验,一来镜子实验测试的是自我意识,而非意识;二来,哲学僵尸在外在看来与人完全一样),没有体验。事实上,Krohn-Rhodes定理证明,任何有限状态机,都可以被前馈结构所替代,功能完全一致[12]。
如果我们接受IIT理论的一些推论,或是其他任意理论,我们都可以问出一个问题:为了自己活下去,繁育后代,其他的大脑结构也可以,为何我们就进化出了意识呢?
或者更简短地说:我们为何拥有意识?拥有意识体验有什么好处?
主流的意识理论似乎都没有正面的回答。
8.结语
我在这里介绍了几种主流的意识理论,在一些人看来,好像我们对意识已经完全了解,甚至可以动手计算了;在另一些人看来,似乎什么都没说——「意识乃是至高至玄之物,非我等凡人可窥之堂奥」。但我恰恰就是要反对这两种观点:我们没有完美的意识理论,但也不是完全不能下手。
我们在将来会有一个完善的意识理论吗?我表示谨慎乐观。从乐观的方面看,我们应该会发现一种理论,能够解释、预言各种意识体验;从谨慎的角度看,由于「莱布尼兹之堑」的存在,通过观测似乎永远无法跨越客观与主观、实验与体验。
最后,做个不负责任的判断:自指可能是解决意识的一把钥匙,因为它几乎可以和上述的所有理论联系起来。
对于更高层次理论来说,泛函动力学的实验[13]说明:自指映射可以自然地涌现出符号,即更高层次理论中所说的「元表示」;
对于全局工作空间来说,同样是泛函动力学:自指映射可以自发的把功能和数据拆分开,这与全局空间对应了起来;
对于整合信息理论,自我指涉,本身就是一种回路,有很大希望得到一个比较高的Phi;
而对于再入与预测加工理论,关系则更为密切:如果一个系统要预测其自身,就需要对自身建立一个抽象的模型,如此,自指便自然产生了。
更进一步,很多人混淆的「自我意识」,也能包含在自指的框架之内。但这些都是一些方向性的猜想,还没有坚实的实验。
参考文献
Seth,A.K.,Bayne,T.Theoriesofconsciousness.NatRevNeurosci().