如果大脑如何工作的机制可以像热力学一样系统完美地解释,那么这个理论终究会是物理学家的梦想。还有一篇神文差一点就赢了。这套理论可以称为自由能定律。如果通读这篇文章,你也会觉得脑科学、人工智能、物理学甚至经济学都是开放的。不过估计99%的物理读者很难读懂这篇文章(《自由能原理:一个统一的大脑理论》)
物理学中的自由能定律是什么?总之,任何处于平衡状态的自组织系统都趋向于处于最小自由能状态。这是什么意思?什么是自由能?自由能和大脑有什么关系?
什么是自由能?E-TS,自由能的物理公司,极其简洁,e是能量,s是熵。根据统计物理学,当一个与外界有能量交换的系统(桌子上一杯热水,下面放一颗冰糖)处于平衡状态时,自由能最小(水温下降,冰糖扩散),这意味着能量尽可能小,熵尽可能大的状态。当水温降至室温时,冰糖均匀膨胀,此时整个水分子与外界环境所能获得的微观状态数是最有可能的状态,或者说是稳态。比如一个教室里没有老师,学生就会逐渐变得混乱,这种混乱状态就是稳态。最小自由能是热力学第二定律下系统与外界环境相互作用的规律。
生物系统呢?生物系统和水系统正好相反,因为它们是开放的、不平衡的、耗散的系统,所遵守的规律处于有序的、结构明确的状态,相当于一个在老师严格控制下的教室,学生工作井然有序(这样的状态需要外部的能量传递,比如老师的工资)。所以我们常说,生物在相反的方向上服从热力学第二定律——即创造和维持秩序,关闭大部分自由态。如果你在某个时刻开始失去对自己的控制,那就是衰老的开始。恰到好处的是,生物系统也可以通过形式和类型的最小自由能定律来组合。表现在认知系统上,就是学习过程!看完之后,你会立刻发现它与机器学习的联系。
简单来说,你可以把你的大脑想象成刚才提到的那杯水。外界环境与这杯水有能量交互关系,对应你的大脑通过眼睛、耳朵等东西收集外界信息(感知)。这杯水越来越趋向室温,你的大脑就像这杯水一样与外界交换能量和信息。但是在这个过程中,你的大脑越来越丰富来自外界的信息,不仅被动的采纳,还主动的预测和行动。
再看我们通常所说的大脑处理外界信息的过程,包括以下几个方面:知觉决定了包含哪些数据,认知处理这些数据,比如分类,动作是由认知的分类引起的决策,运动是由一系列行为组成的。
让我们看看这个过程是如何发生的。首先,对所有这些行为的综合治理都是为了最大限度的存在,外界充满了危险。如果把生物的所有行为可能性都做成一种状态空,那么只有少数能保证生存。越多的生物能在这种稀有状态下绑定,存活的几率就越大。这也是生物需要抵抗热力学第二定律的原因。那么,怎样才能不误入歧途呢?
一方面我们有遗传编码,所以我们的表型只能在有限的范围内(用一个条件概率函数P(pIg)来描述)。这套编码在我们祖先的自然选择中被遗传了下来,大部分不适合生存的可能性都被消除了,比如三头六臂的出现。
另一方面,作为一种具有认知能力的动物,学习是保证生存最有利状态的途径,大脑对外来信号的整个加工过程都可以通过“学习”来了解,请看下图(请时刻思考机器学习)。
根据大脑最小自由能定律,学习的状态是让1。通过不断调整行为,可以得到满足大脑预期的感知状态(准确性)。2.大脑的内部状态能更准确的匹配外部世界的变化,不会出现意想不到的发散。是什么让这两部分合在一起使上图定义的大脑自由能函数最小化?这个原则的力量是巨大的。它可以告诉你很多你为什么这么想,即使你从来没有意识到。比如为什么你看到了你想看到的,为什么你想到的东西总是随时客观的调整?
注意:在第一项D中,P是已知生物感知到某个外部世界状态的概率,Q是已知内部大脑状态的生物猜测到某个外部世界状态的概率,D是P和Q概率分布函数之间的距离,指大脑猜测到的现实之间的距离。第二项是对数项中的p是知道外界的变化,得到某种知觉状态的概率。
来自外界的信息是无限的,我们有那么多的大脑,选择输入哪些信息就显得尤为重要。感知的过程就是一个数据采样的过程。机器学习的学生都知道,开始输入什么特征是机器学习的决定性一步,感知也是如此,该采样哪些数据。所以感知绝不是被动的过程。
这里的关键是理解一个循环中的感知、认知和行为。这里理解的框架是贝叶斯决策。贝叶斯公式将事物之间的关系表现为一系列条件概率关系,并根据新的证据不断调整条件概率。最后,我们想优化我们想要的结果。比如这里的生存机会,通常是生物系统优化的量。为了优化生存机会,我们只有几个想要达到的结果。我们需要产生一个决策机制,最大化这一系列结果的机会(所谓我们不是为了思考而思考,而是为了生存而思考),决定感知和认知。
那么我们如何通过学习找到这种机制呢?其实你会发现这是一个模型选择的过程,符合机器学习的本质。所谓认知,就是找到一个预测模型,让感知到的信号能够预测到外部物体未来的运动,从而趋利避害。感知就是找到最有用的证据(特征工程),可以提供这个模型的预测有效性。总之,世界很大,我只要和我的游戏最相关的。
行为呢?我们的行为最终应该归于感官,所谓的生活情趣也是。如果行为带来了甜甜的巧克力或者可爱的美女,就会得到奖励,符合你理想的生存预期。一个非常有趣的例子说明了认知模型:一个在黑暗中摸索的人,他不断猜测前方有什么,会主动伸出手来,确认自己的想法。一般情况下,如果我们发现自己的确认与自己内心的想法不符,我们会不断探索,直到符合它的预期。这是一个简单的认知模型。
我们可以看到,认知模型包括两个方面,一个是通过感知和行为获得的外部世界的状态,另一个是大脑中认知过程的内部状态(模型)。这种内部模型不断预测每种感觉背后的动机和其中包含的未来变化,而行为本身则倾向于那些有利于生存的行为。学习的目的一方面是为了使内部状态的模型更加准确(准确预测),另一方面是为了使行为决策获得更多有利于生存的证据。如果模型的预测不正确,行为决策就不能得到正确的结果。
这个原理的启示非常强大,可以直接打开认知科学和机器学习的很多方面:
1.贝叶斯大脑假说:前面提到过,大脑是贝叶斯机器。贝叶斯推理和决策的核心是利用最新证据更新先验概率,获得后验概率。认知科学的核心就是这样一个过程。
下面是两句关于认知的话。在机器学习的语言中,认知的过程是利用大脑的内部变量来模拟外部世界,希望建立内部世界和外部世界一一对应的映射关系。这里我们说认知模型是一个概率模型,可以用一系列条件概率来描述。如果用一个形象的比喻,你可以把你的大脑想象成一个可以自由切断的巨大仓库。你要把外界不同种类的商品放到不同的分区。你的大脑必须具备推测和推导外界真实变化的能力,也就是随时根据新的证据进行调整的能力。你和外界的模式越匹配,你的大脑就会越有效率。认知是对外界运动的一种编码。可以马上联想到机器学习中的表示法。如果你熟悉RNN或CNN的嵌入过程,你会有一种豁然开朗的感觉,虽然你此刻并不知道它对鸟类有用。
作者简介
作者徐铁,微信号:铁巡洋舰
法国巴黎师范大学物理硕士,以色列理工大学计算神经科学博士(以色列85%科技创业人才的摇篮,计算机科学享誉全球),Cruiser科技有限公司创始人,纸质书《机器学习与复杂系统》作者。在香港浸会大学非线性科学中心工作一年,是个好战友。
1.《自由能 大脑的自由能假说-兼论认知科学与机器学习》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《自由能 大脑的自由能假说-兼论认知科学与机器学习》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/junshi/785705.html