生物演化与脑神经科学研究正不断给我们带来启发。上世纪40年代的智能探索中,还有太多思想宝藏值得挖掘。

生物智能发展史 从第一颗大脑到人类智能的爆发
约40亿年前,地球上的某个海洋深处的火山口附近出现了第一条DNA分子链。

约35亿年前,第一个可被成为“生物”的古菌出现,它被称为“LUCA”,科学家们认为它极有可能是地球上所有生命的共同祖先。

约5.5亿年前,地球上的第一个大脑出现。自此,生物大脑能够趋利避害、整合信息、持续学习。

地球上第一个拥有大脑的生物nematode
约5亿年前,生物开始有了视觉,对环境的感知能力跃升,最早的脊椎动物也在寒武纪诞生。此后,生物的学习能力得到飞跃。

寒武纪生物大爆发
从最初的 DNA 到出现拥有大脑的生命,用了36亿年;从第一个大脑出现到寒武纪生命大爆发仅仅过去了5000万年。

生命作为智能的载体,通过遗传物质传承生物物种的记忆给下一代;同时也产生变异,在变异过程中通过自然选择,形成了物种的演化。
我们所生存的这个世界的可预测性,成为了生命智能得以产生并不断发展的根本原因。智能的机制在生物演化中不断发挥作用,生物智能本身也在漫长的历史中逐渐演进——从依赖基因遗传和自然选择(phylogenetic,),进化到个体本身的后天学习与适应(ontogenetic)。
直到人类诞生,智能的发展再次迎来飞跃。

作为社会动物,交流让人类的群体智慧跃升。语言诞生后,知识可以开始相互交流分享,并逐渐积累。社会智能的发展依赖于语言与文本、经验知识与反复试错。
文字的产生加之强大的抽象能力,让数学、科学等等人类文明成果得以产生。智能的机制进一步在人类个体和群体中发挥作用。在这个过程中,人类科技文明指数级发展。人工智能(指真正的词源本身含义)的发展依赖科学事实、理论化、假设检验与证伪。
直到有一天,人脑——这个自然界智能机制的演化结果之一,竟然开始思考:“智能本身,究竟是什么,有没有可能让机器也拥有智能……”
人类的智能探索之路 从“黄金四十年代”到人工神经网络
We are not stuff that abides, but patterns that perpetuate themselves.
我们并不是永恒的实体,而是延续自身的模式。
——诺伯特·维纳
上世纪 40 年代是人类探索智能的黄金时代,智能的探索之路上群星闪耀。一批智慧的人类大脑开始思考和研究关于智能的一切:
•1943年,沃伦·麦卡洛克和沃尔特·皮茨提出人工神经网络
•1940年代,艾伦·图灵提出了图灵机及图灵测试
•1944年,约翰·冯·诺依曼提出博弈论与现代计算机架构
•1948年,克劳德·香农提出信息论
•1948年,诺伯特·维纳提出控制系统论

控制论——在动物与机器中的控制和通信
他们思考的问题包括且不限于:
• “有没有可能把动物或者人的智能转移到机器的身上,通过机器来模拟这些智能的机制和行为?”
• “计算如何通过机器实现?”
• “动物如何通过反馈、纠错来学习和改进?”
• “怎样通过跟外部环境或者对手博弈,不断地提高决策质量?”
• “一个系统如何从外部世界学习有用的信息,这些信息如何组织管理、度量?”
这些伟大的问题和为回答这些问题所做的伟大研究一起,为后续人类的智能探索开辟了一条条康庄大道,也为我们今天的研究奠定了扎实的基础。
有了40年代诞生的人工神经元模型后,开始建立系统和网络,神经网络的概念自此产生。而人工神经网络的诞生与发展本身,同样是人类一次次从生物学和神经科学研究中获得灵感的结果:

此后这80年间,我们看到人工神经网络两次经历寒冬,也亲眼见证它迎来爆发。这期间,凝聚了太多科学家的贡献贡与坚持。

而我们,在为人工神经网络的成功以及为人类带来的卓越贡献感到欣喜的同时,也必须继续思考——面对未来,还有什么需要我们贡献和探索。

一个必须直面的问题是 —— 我们是否应该任由智能系统一直作为黑盒而存在?
打开系统黑盒 走向自主智能
What I cannot create, I do not understand.
如不能自己创造,则无法真正理解。
—— 理查德 · 费曼
忆生科技对这个问题的回答是——“NO!”
黑盒无法解释;无法保障安全;改进成本高昂;且无法持续学习;甚至还可能导致谣言与恐惧。必须找到更好的方式解决黑盒问题,让智能系统透明化、可解释,从黑盒走向白盒。
正如维纳对“如何理解智能”的精妙阐释:
“The simplest way to think of intelligence is as the ability to predict the future and act on those predictions.
(最简单地理解智能的方法是——将其视为预测未来,并根据这些预测采取行动的能力)”
我们相信:世界的可预测性是生物智能得以存在的基础,也是机器智能系统具备真正学习能力的前提。
正如爱因斯坦对科学理论原则的优雅总结:
“Everything should be made as simple as possible, but not simpler.
(一切事物都应尽可能简单,但不能过于简单)”
我们认为:如生物大脑一样实现简约且自洽的学习方式,是符合上述原则且是可以最终实现的。

从智能角度思考,机器智能究竟是在学习什么?
如前文所说,我们相信——智能存在和演化的根本原因在于:世界并非完全随机,仍在很大程度上是可预测的。
智能与科学,都是从对外部世界的感知数据中,学习那些可被预测的部分(从这个意义上说,每一种动物都是“牛顿”,都已经学习到一个足够准确的“世界模型”)。

而从数学的角度来看,所有可预测的信息,都被编码为观测到的高维数据空间中,具有低维支撑的分布 p(x)。

补全能力是低维结构的重要性质。

从数学角度,学习的主要目标是:从感知到的数据 𝒙 中识别出具有低维结构的分布,并将其转换为一个紧凑且结构化的表示 —— 𝒛。

机器又究竟应该如何学习?
通过压缩来降低观测(含噪声)数据分布的熵,是学习低维结构的一种基本且统一的机制。

从数百万维的空间中,通过迭代去噪实现压缩,

比如 —— 通过经验设计的网络来实现去噪算子:

甚至于,通过解析推导得到的运算来实现去噪算子:

忆生创始人马毅教授的ReduNet 工作,从最大编码率压缩(MCR²)出发,将表征学习的优化过程展开为多层网络,使各层算子皆可解析推导,从而形成结构透明、可解释的白盒深度模型:

而CRATE 不仅在数学上实现了可被完全解释,而且在语义层面也更加可解释。

近年来的研究成果表明——我们完全可以从第一性原理构建更优质的网络,而不是只能通过反复试错来实现网络优化。2023-2025年间,我们的多项工作都指向一个可解释、可扩展、更高效且更紧凑的网络。

从黑盒到白盒——我们完全可以不再通过反复试错来设计更好的网络结构:

迈向自主智能——AI2.0
早在上世纪40年代,天才的诺伯特·维纳就曾经指出——自然界中,所有的智能系统都是利用闭环机制学习。我们要让系统自行实现双向编码与解码,对应识别与生成。通过控制与博弈,实现闭环反馈纠错、自主学习、自我改进。

事实上,近年来的前沿神经科学研究也明确告诉我们——相似的特性和机制在自然界中无处不在!

视觉皮层中的稀疏编码(Olshausen, Nature 1996)
子空间嵌入(Tsao, Cell 2017,Nature 2020)
视觉皮层中的预测编码(Rao, Nature Neuroscience 1999)
而当我们向神经科学学习,有一些问题就必须追问——
简约性:在神经科学中,有哪些证据可以用来验证这一原理?
自洽性:在神经科学中,有哪些证据可以用来验证这一原理?
前向优化 vs. 反向传播?
闭环 vs. 开环?
自我纠错或自我改进的机制?

正如如被誉为深度学习之父的杰弗里辛顿2022年在NeurIPS的那场著名演讲 ——The Forward-Forward Algorithm for Training Deep Neural Networks。他开始重新质疑反向传播的生物合理性,认为我们的大脑不像现在的深度学习那样一层层“反传梯度”,所以它可能不是大脑真正使用的学习算法。
回到计算机科学视角,我们一直相信——更符合自然的智能模式,理应是值得坚持探索的方向!

从四十年代对智能的思考,到人工神经网络一路以来的发展——生物学与神经科学总是一次次为人类的智能探索带来启发。
现在,是时候重新向自然学习了!

忆生其名——生成记忆,记忆生成
The best theory is inspired by practice,the best practice is inspired by theory.
最好的理论来源于实践,最好的实践来源于理论。
--Donald E. Knuth
关于“忆生”其名
中文文字本身极具内涵。
例如“记忆”(memory)这个词,是通过两个互补的动词“记”与“忆”组成。由两个相辅相成、形成的闭环的两个过程定义一个名词。这在全世界的语言中应该是独一无二的。而这也正好对应于目前我们对同时具有识别和生成功能的人工智能系统的理解。
“记”对应于感知“encoding”,而“忆”对应于生成“decoding”。这也正是忆生科技名称的由来 —— 取的是“生成记忆、记忆生成”之意。

围绕记忆机制,搭建闭环系统
面向具身智能的需求场景,我们正在围绕大脑的记忆机制搭建起闭环系统,包括语义和几何感知、基于记忆的视觉内容理解、基于多模态的推理、具有适应性/泛化性动作执行能力的机器人手。

产品架构也高度对应我们独特的技术实力,正在构建智能机器人的大脑与小脑,实现眼脑手协同的智能:

迈向自主智能,加快智能化发展的阶段性跃升
我们认为机器智能的发展将经历三个阶段。我们正在努力推动从阶段一(AI 1.0)到阶段 二(AI 2.0)的跃升!

面向未来,我们将——打破语言对模型形态的束缚,以视觉为中心建立多模态模型系统,推动智能系统的“寒武纪大爆发”;我们将——让每一个机器智能系统具有自主学习和获取新知识的能力,真正实现自主智能(Autonomous Intelligence)——AI2.0。
选择少有人走的道路,是因为看到了更远处的风景。
期待你与我们同行,一起开启自主智能新时代!