一、回归理论基石，探索智能本质

从第一颗大脑到人类智能的爆发

生命与智能的演化，都有统一的规律在发挥作用。

正如 熵的持续增加 是宇宙演化的基本规律，生命的基本规律就是不断积累能减少（预测未来）熵 的知识。

生物智能的演化历史持续给科学家带来启发：

约40亿年前，地球上的某个海洋深处的火山口附近出现了第一条DNA分子链。

约35亿年前，第一个可被成为“生物”的古菌出现，它被称为“LUCA”，科学家们认为它极有可能是地球上所有生命的共同祖先。

约5.5亿年前，地球上的第一个大脑出现。自此，生物大脑能够趋利避害、整合信息、持续学习。

地球上第一个拥有大脑的生物nematode

约5亿年前，生物开始有了视觉，对环境的感知能力跃升，最早的脊椎动物也在寒武纪诞生。此后，生物的学习能力得到飞跃。

寒武纪生物大爆发

从最初的 DNA 到出现拥有大脑的生命，用了36亿年；从第一个大脑出现到寒武纪生命大爆发仅仅过去了5000万年。

生命作为智能的载体，通过遗传物质传承生物物种的记忆给下一代；同时也产生变异，在变异过程中通过自然选择，形成了物种的演化。

我们所生存的这个世界的可预测性，成为了生命智能得以产生并不断发展的根本原因。智能的机制在生物演化中不断发挥作用，生物智能本身也在漫长的历史中逐渐演进——从依赖基因遗传和自然选择（phylogenetic，），进化到个体本身的后天学习与适应（ontogenetic）。

作为社会动物，交流让人类的群体智慧跃升。语言诞生后，知识可以开始相互交流分享，并逐渐积累。社会智能的发展依赖于语言与文本、经验知识与反复试错。文字的产生加之强大的抽象能力，让数学、科学等等人类文明成果得以产生。智能的机制进一步在人类个体和群体中发挥作用。在这个过程中，人类科技文明指数级发展。

直到有一天，人脑——这个自然界智能机制的演化结果之一，竟然开始思考：“智能本身，究竟是什么，有没有可能让机器也拥有智能……”

人类的智能探索之路从“魔法时代”到人工神经网络

上世纪40年代的智能探索中，有太多思想宝藏值得挖掘。

上世纪 40 年代是人类探索智能的黄金时代，智能的探索之路上群星闪耀。一批智慧的人类大脑开始思考和研究关于智能的一切：

他们思考的问题包括且不限于：

• “有没有可能把动物或者人的智能转移到机器的身上，通过机器来模拟这些智能的机制和行为？”

• “计算如何通过机器实现？”

• “动物如何通过反馈、纠错来学习和改进？”

• “怎样通过跟外部环境或者对手博弈，不断地提高决策质量？”

• “一个系统如何从外部世界学习有用的信息，这些信息如何组织管理、度量？”

这些伟大的问题和为回答这些问题所做的伟大研究一起，为后续人类的智能探索开辟了一条条康庄大道，也为我们今天的研究奠定了扎实的基础。

有了40年代诞生的人工神经元模型后，开始建立系统和网络，神经网络的概念自此产生。而人工神经网络的诞生与发展本身，同样是人类一次次从生物学和神经科学研究中获得灵感的结果：

此后这80年间，我们看到人工神经网络两次经历寒冬，也亲眼见证它迎来爆发。这期间，凝聚了太多科学家的贡献与坚持。

而我们，在为人工神经网络的成功以及为人类带来的卓越贡献感到欣喜的同时，也必须继续思考——面对未来，还有什么需要我们贡献和探索。

大量研究已经表明——现有的大语言模型和多模态大模型，不仅容易产生灾难性遗忘，同时存在明显的视觉短板：

一个必须直面的问题是——我们是否应该任由智能系统一直作为黑盒而存在？

二、打开系统黑盒

What I cannot create, I do not understand.

不是自己创造（发现）的（知识），我不能理解。

—— 理查德 · 费曼

忆生创始团队对这个问题的回答是——“NO!”

黑盒无法解释；无法保障安全；改进成本高昂；且无法持续学习；甚至还可能导致谣言与恐惧。必须找到更好的方式解决黑盒问题，让智能系统透明化、可解释，从黑盒走向白盒。

正如维纳对“如何理解智能”的精妙阐释：

“The simplest way to think of intelligence is as the ability to predict the future and act on those predictions.

（最简单地理解智能的方法是——将其视为预测未来，并根据这些预测采取行动的能力）”

我们相信：世界的可预测性是生物智能得以存在的基础，也是机器智能系统具备真正学习能力的前提。

从智能角度思考，机器智能究竟是在学习什么？

如前文所说，我们相信——智能存在和演化的根本原因在于：世界并非完全随机，仍在很大程度上是可预测的。

智能与科学，都是从对外部世界的感知数据中，学习那些可被预测的部分（从这个意义上说，每一种动物都是“牛顿”，都已经学习到一个足够准确的“世界模型”）。

而从数学的角度来看，所有可预测的信息，都被编码为观测到的高维数据空间中，具有低维支撑的分布 𝑝(𝒙)。

机器又究竟应该如何学习？

忆生创始人马毅教授的ReduNet 工作，从最大编码率压缩（MCR²）出发，将表征学习的优化过程展开为多层网络，使各层算子皆可解析推导，从而形成结构透明、可解释的白盒深度模型:

而CRATE 不仅在数学上实现了可被完全解释，而且在语义层面也更加可解释。

近年来的研究成果表明——我们完全可以从第一性原理构建更优质的网络，而不是只能通过反复试错来实现网络优化。2023-2025年间，我们的多项工作都指向一个可解释、可扩展、更高效且更紧凑的网络。

如何才能学正确？

三、迈向自主智能

早在上世纪40年代，天才的诺伯特·维纳就曾经指出——自然界中，所有的智能系统都是利用闭环机制学习。我们要让系统自行实现双向编码与解码，对应识别与生成。通过控制与博弈，实现闭环反馈纠错、自主学习、自我改进。

事实上，近年来的前沿神经科学研究也明确告诉我们——相似的特性和机制在自然界中无处不在！而站在今天的时间节点，我们应该再次向自然学习。

而当我们向神经科学学习，有一些问题就必须追问——

简约性：在神经科学中，有哪些证据可以用来验证这一原理？
自洽性：在神经科学中，有哪些证据可以用来验证这一原理？
前向优化 vs. 反向传播？
闭环 vs. 开环？
自我纠错或自我改进的机制？

正如如被誉为深度学习之父的杰弗里辛顿2022年在NeurIPS的那场著名演讲 ——The Forward-Forward Algorithm for Training Deep Neural Networks。他开始重新质疑反向传播的生物合理性，认为我们的大脑不像现在的深度学习那样一层层“反传梯度”，所以它可能不是大脑真正使用的学习算法。

回到计算机科学视角，我们一直相信——更符合自然的智能模式，理应是值得坚持探索的方向！

从四十年代对智能的思考，到人工神经网络一路以来的发展——生物学与神经科学总是一次次为人类的智能探索带来启发。

现在，是时候重新向自然学习了（类大脑皮层的计算模型）！

正确定义“智能”

生命的出现乃至科学的发展都是智能机制起作用的结果：

唐纳德·克努特（高德纳）曾说：“最好的理论来自于实践、最好的实践来自于理论（The best theory is inspired by practice,

the best practice is inspired by theory）。“

为“智能”（至少学习知识这一层）寻找科学与理论基础：

• 学什么？简约性

• 怎么学？压缩

• 为什么正确？一致性

未来，智能将是结合了生命科学、数学与计算的终极前沿。

向自主智能攀登

从智能机制上，机器智能将会经历三个阶段，目前的机器智能技术正处在从第一阶段向第二阶段过渡的进程中。我们正在努力推动从阶段一(AI 1.0)到阶段二(AI 2.0)的跃升！

围绕记忆机制，理解物理世界，搭建闭环系统

中文文字本身极具内涵。例如“记忆”（memory）这个词，是通过两个互补的动词“记”与“忆”组成。由两个相辅相成、形成的闭环的两个过程定义一个名词。这在全世界的语言中应该是独一无二的。而这也正好对应于目前我们对同时具有识别和生成功能的人工智能系统的理解。

“记”对应于感知“encoding”，而“忆”对应于生成“decoding”。这也正是忆生科技名称的由来 —— 取的是“生成记忆、记忆生成”之意。

从寒武纪的第一双眼睛开始，生物就形成了“视觉+大脑+行为”的自主的反馈闭环。而我们人类利用眼（视觉感知）、脑（理解预测）、手（运动控制）协同，来实现与环境的交互。

面向具身智能的需求场景，我们正在围绕大脑的记忆机制搭建起闭环系统，包括语义和几何感知、基于记忆的视觉内容理解、基于多模态的推理，以及具有适应性/泛化性动作执行能力的机器人手，着力构建起覆盖视觉感知（物理世界模型）和运动控制（物理本体模型）的自主智能系统。

面向未来，我们致力于向智能的下一个阶段迈进——打破语言对模型形态的束缚，推动智能系统的“寒武纪大爆发”。我们将——让每一个机器智能系统具有自主学习和获取新知识的能力，真正实现自主智能（Autonomous Intelligence）——AI2.0。

我们相信——相信真正的智能源于对物理世界的深刻理解与互动能力，我们通过研发视觉记忆与运动记忆完成智能交互，构建支撑具身智能的两大基石：一方面利用视觉感知精准解析环境的几何结构、语义信息及空间关系；另一方面通过运动控制实现基于视觉反馈与指令的物理环境交互。通过这一独特的双记忆融合的世界模型路径，忆生将单纯的感知数据成功转化为智能体对物理世界的识别、预测、推理以及自主互动的能力。不仅是在构建算法，更是在赋予智能体理解物理法则的“大脑”，使其能够像人类一样在复杂环境中作业，为下一代机器人系统提供最前沿的智能底座。

近段时间以来，忆生科技在多模态数据挖掘、长序列图像 3D 重建、单图快速三维重建等多个指向企业愿景的人工智能关键领域取得了世界领先的突破性成果。同时，在注意力机制优化、自监督学习训练等智能领域底层机制研究上斩获重磅科研成果。相关技术成果正加速落地。

期待你与我们同行，一起开启自主智能新时代！

探索智能本质，深耕记忆机制，迈向自主智能时代

一、回归理论基石，探索智能本质

从第一颗大脑到人类智能的爆发

人类的智能探索之路从“魔法时代”到人工神经网络

二、打开系统黑盒

从智能角度思考，机器智能究竟是在学习什么？

机器又究竟应该如何学习？

如何才能学正确？

三、迈向自主智能

正确定义“智能”

向自主智能攀登

围绕记忆机制，理解物理世界，搭建闭环系统

视频｜忆生科技创始人马毅上海交大学术演讲：Pursuing the Nature of Intelligence

CAD-MLLM：文本、图像、点云任意模态输入，AI能够一键生成高质量CAD模型了

监督微调（SFT）vs 强化学习（RL）

探寻智能本质，开创AI新时代，忆生科技创始人马毅新年科学演讲

首个基于统计学的线性注意力机制ToST，高分拿下ICLR Spotlight

前沿观点｜杨立昆：当前AI理解世界水平不如猫，理解物理世界等是机器人的AI基础

更高效的白盒模型ToST，ICLR2025 Spotlight

SimDINO:用编码率正则化重构DINO和DINOv2 ， ICML2025

All-Angles Bench: 全面评估MLLMs的多视图理解能力

前沿观点｜杨立昆在国际学术交流中高度评价马毅团队MCR2研究成果

探索智能本质，深耕记忆机制，迈向自主智能时代

一、回归理论基石，探索智能本质

从第一颗大脑到人类智能的爆发

人类的智能探索之路 从“魔法时代”到人工神经网络

二、打开系统黑盒

从智能角度思考，机器智能究竟是在学习什么？

机器又究竟应该如何学习？

如何才能学正确？

三、迈向自主智能

正确定义“智能”

向自主智能攀登

围绕记忆机制，理解物理世界，搭建闭环系统

人类的智能探索之路从“魔法时代”到人工神经网络