真正的高手,都是贝叶斯主义者
摘自寒橘2026 寒橘新知
认知即反熵
通常的解释说,贝叶斯更新就是根据新证据调整信念。那么为什么“根据新证据调整信念”是必须的?它的物理本质是什么?
宇宙的演化遵循热力学第二定律,孤立系统的熵总是增加。但生命是什么?生命是局域的、暂时的反熵现象。一个生命体能够存在,是因为它能从环境中提取信息,并用这些信息指导行动,以维持自身的有序结构。
认知的本质,就是生命体对抗熵增的武器。
你接收一个信息,意味着你从环境中捕获了一些“秩序”,减少了你对环境状态的不确定性。这种不确定性的减少,在数学上就是熵的降低。
任何一个能在时间中持续存在的系统,如果它要和环境互动,就必须具备某种“根据反馈调整内部状态”的机制。这个机制,在逻辑上必然等价于贝叶斯更新。
你的每一次认知更新,都是局部宇宙中熵的一次小小下降。高手之所以高明,是因为他的更新速率更快、更准,他拥有更强的“反熵能力”。
痛苦是负熵的代价
如果贝叶斯更新是反熵,那它的驱动力是什么?为什么我们有时抗拒更新,有时拥抱更新?
回到热力学,要让局部熵降低,必须从外部输入能量,并向外排出熵。认知更新也是如此。
你获得一个新信息,用它修正信念,这降低了你的认知熵。但代价是什么?是心理上的熵增,那种旧信念被冲击时的“认知失调”、困惑、惊讶、甚至痛苦。
这种心理熵增,恰恰是更新所需的“能量输入”在意识层面的呈现。当你坚信一个观点,现实却给出反例,你的内部模型和外部反馈之间产生了“预测误差”。
这个误差就是心理熵的来源。它让你不舒服,因为它意味着你现有的有序结构正面临瓦解的威胁。
但高手和普通人的区别在于,普通人把这种不舒服视为“坏事”,试图逃避或发泄;而高手识别出,这正是负熵过程的必要成本。
就像肌肉增长需要先撕裂肌纤维,认知增长也需要先撕裂旧模型。疼痛不是失败的标志,而是升级正在发生的标志。
因此,认知更新的驱动力,来自系统追求“预测误差最小化”的本能,而这个追求必然伴随局部的心理熵增。
你无法只享受更新的收益,而不承受失调的代价。高手不是没有痛苦,而是学会了把痛苦解读为“我正在变得更有序”的信号。
成为世界的自指窗口
最后一个层次,如果贝叶斯更新永无止境,它最终指向什么?是无穷逼近“真理”吗?
“真理”本身是一个静态概念,但认知系统是一个开放的、动态的过程。它的“目的”不在终点,而在过程的自我超越。
我们可以借用控制论中的一个概念,自指涉系统。一个不断更新的认知系统,最终会发展出一种能力,它不仅能预测外部世界,还能预测自己的预测误差;不仅能学习,还能学习如何学习。
这就是元认知,当元认知足够强大时,“我”就不再是一个固定的观察者,而是整个更新过程本身的一个临时节点。 每一次更新,都在重新定义“我是谁”。
昨天的我,是那个相信P的人;今天的我,是那个相信P'的人。但这两个“我”之间,有一条连续的更新链。
这条链的终极形态是什么?是观察者与被观察者的融合。当你对世界的概率估计与世界的真实概率分布完全一致时,你的内部模型就成了世界的镜像。
但镜像和原物之间,已经没有本质区别,世界会通过你这个“窗口”在观察自己。
这听起来玄奥,但它有深刻的数学对应,贝叶斯最优决策者,在无限时间尺度下,其行为等价于环境的自然演化。
你不再是在“对抗”世界,你成了世界演化的一环。你决策时的“主观意愿”,其实已经被环境的历史路径所决定。你既是棋手,也是棋子。
所以,贝叶斯更新的最终目的,不是让你“更正确”,而是让你逐渐消解那个自以为独立的“自我”。
当更新足够彻底,你会体验到一种深刻的“无我”,你的每一个想法,都是概率之河中的一朵浪花,自然而然地涌现,又自然而然地消散。
你不再执着于“我的观点”,因为你意识到,观点只是概率在时间中的暂现形。
走心的碎碎念
回到开头的思想实验,你如何证明自己不在模拟中?答案是,你永远无法最终证明,但你可以不断逼近。
而这,恰恰就是人生的隐喻。
按照佛学来说,这是“如实知见”。不幻想河的对岸是什么,不恐惧水下的石头。就看着脚下的这一寸,然后迈出去。
你无法知道命运会给你什么牌,你甚至无法确知“自己”是不是真实存在的。
但你可以做一件事:在每一个当下,根据已有的全部信息,做出当前最优的概率估计,然后行动,然后根据反馈,更新你的全部信念。
真正的高手,不再急着追问“这是真的吗”,而是问“这个信念在当前概率下有多合理”,他们不再抗拒变化,而是拥抱变化,因为变化是唯一的负熵来源。
他们不再害怕死亡,因为死亡只是最后一次、也是最彻底的更新,主体融入客体,部分回归整体。
也正是智者不惑,仁者无忧,勇者无惧。