忆生科技
Published on 2024-12-23 / 124 Visits

探索智能本质,理解记忆机制,加速迈向自主智能时代

生物演化与脑神经科学研究正不断给我们带来启发。上世纪40年代的智能探索中,还有太多思想宝藏值得挖掘。

生物智能发展史

从第一颗大脑到人类智能的爆发


约40亿年前,地球上的某个海洋深处的火山口附近出现了第一条DNA分子链。

约35亿年前,第一个可被成为“生物”的古菌出现,它被称为“LUCA”,科学家们认为它极有可能是地球上所有生命的共同祖先。

约5.5亿年前,地球上的第一个大脑出现。自此,生物大脑能够趋利避害、整合信息、持续学习。

地球上第一个拥有大脑的生物nematode

约5亿年前,生物开始有了视觉,对环境的感知能力跃升,最早的脊椎动物也在寒武纪诞生。此后,生物的学习能力得到飞跃。

寒武纪生物大爆发

生命作为智能的载体,通过遗传物质传承生物物种的记忆给下一代;同时也产生变异,在变异过程中通过自然选择,形成了物种的演化。

我们所生存的这个世界的可预测性,成为了生命智能得以产生并不断发展的根本原因。智能的机制在生物演化中不断发挥作用,生物智能本身也在漫长的历史中逐渐演进——从依赖基因遗传和自然选择(phylogenetic),进化到个体本身的后天学习与适应(ontogenetic)。

直到人类诞生,智能的发展再次迎来飞跃。

作为社会动物,交流让人类的群体智慧跃升。语言诞生后,知识可以开始相互交流分享,并逐渐积累;文字的产生加之强大的抽象能力,让数学、科学等等人类文明成果得以产生。智能的机制进一步在人类个体和群体中发挥作用。在这个过程中,人类文明不断发展。

直到有一天,人脑——这个自然界智能机制的演化结果之一,竟然开始思考:“智能本身,究竟是什么……”


人类的智能探索之路

从“黄金四十年代”到人工神经网络

We are not stuff that abides, but patterns that perpetuate themselves.

我们并不是永恒的实体,而是延续自身的模式。

——诺伯特·维纳

上世纪 40 年代是人类探索智能的黄金时代,智能的探索之路上群星闪耀。一批智慧的人类大脑开始思考和研究关于智能的一切:

•1943年,沃伦·麦卡洛克和沃尔特·皮茨提出人工神经网络

•1940年代,艾伦·图灵提出了图灵机及图灵测试

•1944年,约翰·冯·诺依曼提出博弈论与现代计算机架构

•1948年,克劳德·香农提出信息论

•1948年,诺伯特·维纳提出控制系统论

控制论——在动物与机器中的控制和通信

他们思考的问题包括且不限于:

• “有没有可能把动物或者人的智能转移到机器的身上,通过机器来模拟这些智能的机制和行为?”

• “计算如何通过机器实现?”

• “动物如何通过反馈、纠错来学习和改进?”

• “怎样通过跟外部环境或者对手博弈,不断地提高决策质量?”

• “一个系统如何从外部世界学习有用的信息,这些信息如何组织管理、度量?”

这些伟大的问题和为回答这些问题所做的伟大研究一起,为后续人类的智能探索开辟了一条条康庄大道,也为我们今天的研究奠定了扎实的基础。

有了40年代诞生的人工神经元模型后,开始建立系统和网络,神经网络的概念自此产生。而人工神经网络的诞生与发展本身,同样是人类一次次从生物学和神经科学研究中获得灵感的结果:

此后这80年间,我们看到人工神经网络两次经历寒冬,也亲眼见证它迎来爆发。这期间,凝聚了太多科学家的贡献贡与坚持。

而我们,在为人工神经网络的成功以及为人类带来的卓越贡献感到欣喜的同时,也必须继续思考——面对未来,还有什么需要我们贡献和探索。

一个必须直面的问题是——我们是否应该任由智能系统一直作为黑盒而存在?


打开系统黑盒

走向自主智能

What I cannot create, I do not understand.

如不能自己创造,则无法真正理解。

 —— 理查德 · 费曼

忆生科技创始人与科学家团队对这个问题的回答是——“NO!”

黑盒无法解释;无法保障安全;改进成本高昂;且无法持续学习;甚至还可能导致谣言与恐惧。必须找到更好的方式解决黑盒问题,让智能系统透明化、可解释,从黑盒走向白盒。

正如维纳对“如何理解智能”的精妙阐释:

“The simplest way to think of intelligence is as the ability to predict the future and act on those predictions.

(最简单地理解智能的方法是——将其视为预测未来,并根据这些预测采取行动的能力)”

我们相信:世界的可预测性是生物智能得以存在的基础,也是机器智能系统具备真正学习能力的前提。

正如爱因斯坦对科学理论原则的优雅总结:

“Everything should be made as simple as possible, but not simpler.
(一切事物都应尽可能简单,但不能过于简单)”

我们认为:如生物大脑一样实现简约且自洽的计算方式,是符合上述原则且完全可以实现的。

依托最大编码率降低原则(MCR²),我们得以从复杂数据集中有效提取紧凑而强大的特征,大大降低了计算对算力与能源的依赖。

通过优化学习目标的算法推导, 我们实现了数学上的完全可解释:

并在实践中让白盒网络中涌现出了有意义的结构:

仅仅实现高效节能与可解释还不够。早在上世纪40年代,天才的诺伯特·维纳就曾经指出——自然界中,所有的智能系统都是利用闭环机制学习。我们要让系统自行实现双向编码与解码,对应识别与生成。

通过控制与博弈,实现闭环反馈纠错、自主学习、自我改进。

多年以来,先驱们不断地思考关于计算的一切。我们珍视这些充满智慧的思想成果,因此也更坚定地相信——人类对智能的探索, 必须建立在对实现智能的计算复杂度的正确认知上。

而更符合自然的智能模式,理应是值得探索的方向!

记忆

通往智能本质

The best theory is inspired by practice,the best practice is inspired by theory.

最好的理论来源于实践,最好的实践来源于理论。

--Donald E. Knuth

从四十年代对智能的思考,到人工神经网络一路以来的发展——生物学与神经科学总是一次次为人类的智能探索带来启发。对于记忆机制的理解同样如此。我们相信——破解并以智能技术复现动物的闭环记忆系统是通往AGI最佳突破口。

对于包括人类在内的动物的智能而言,存在着两个不同维度的“记忆”,即:所谓的“大脑记忆”与“肌肉记忆”。这两个部分动态变化、相互配合。

“大脑记忆”:显性记忆,主导学习过程

大脑的海马齿状回中,一个印迹细胞engram cells(粉色)(图源/Science)

高等动物大脑的记忆机制包括紧密相关且形成闭环的两个过程:记忆生成——感知外部世界在大脑中对其进行压缩;生成记忆——基于压缩结果生成绚丽的脑中世界。这也正是忆生公司名称的由来。真正具有学习能力的系统是大脑显性记忆的闭环系统。通过科学探索成果与工程技术突破,我们要实现上述完整过程,并最终打造真正可自主学习的智能系统。

“肌肉记忆”:程序化记忆,主导熟练应用

“肌肉记忆”并非指肌肉的记忆,而是指动物脑中的某些部分(尤其是小脑和基底神经节)对动作模式的程序化记忆。主要包括下意识机制下的自动化过程,以及在不依赖意识的前提下确保动作的稳定性。在机器人领域,程序化记忆类的系统被广泛应用,但该领域的智能水平尚不能满足机器人市场日益增长的技术要求。我们正致力将“大脑记忆”与“肌肉记忆”相结合,解决上述问题,真正为机器赋予智能。

迈向自主智能

加快智能化发展的阶段性跃升

我们认为与生物智能曾经的发展历程相似,机器智能的发展将经历三个阶段。

而我们正在努力推动从阶段1 (AI 1.0)到阶段 2 (AI 2.0)的跃升!

面向未来,我们将——打破语言对模型形态的束缚,以视觉为中心建立多模态模型系统,推动智能系统的“寒武纪大爆发”;我们将——让每一个机器智能系统具有自主学习和获取新知识的能力,真正实现自主智能(Autonomous Intelligence)——AI2.0。

选择少有人走的道路,是因为看到了更远处的风景。

期待你与我们同行,一起开启自主智能新时代!