忆生科技发布 CAD 建模框架 Pointer-CAD,完善了CAD 智能化全栈能力版图,多模态世界模型技术路径得到进一步夯实。
近日,忆生科技联合香港大学、深圳河套学院、加州大学伯克利分校等多家机构发布 CAD 建模框架 Pointer-CAD。相关论文已于 3 月 5 日公开在 arXiv,并被 CVPR 接收。

论文地址:https://arxiv.org/abs/2603.04337
该工作聚焦 CAD 智能化中的关键难题:如何让大模型不仅“会生成”,更具备对几何结构进行准确表达、精细编辑与可靠执行的能力。

这并非忆生科技在 CAD 方向上的首次突破。此前,忆生科技已围绕世界模型持续布局,并在 CAD 领域推出全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型CAD-MLLM技术成果|CAD-MLLM:基于多模态输入的CAD生成,推动相关能力从多模态理解与生成向更系统的结构建模演进。
在此基础上,近期发布的 Pointer-CAD进一步补强了在高精度结构表达、几何编辑与可执行生成上的能力版图,是忆生科技将基础模型能力延展到高精度工业场景的重要技术模块。
CAD 广泛应用于机械、建筑、工业制造、芯片设计等高精度场景,是现代工程体系中的核心基础软件之一。但其智能化长期面临瓶颈:传统基于命令序列的生成方法,难以支持复杂实体选择与精细编辑,同时连续变量离散化也容易带来拓扑错误,影响真实工程场景中的可用性。
CAD-MLLM 与 Pointer-CAD 不仅是在解决 CV 领域的 3D 形状生成问题,更是在解决工程领域的“可制造性”问题。通过攻克大模型的“尺寸感知”与“拓扑一致性”两大壁垒,AI 生成的不再是仅供渲染的网格,而是自带参数历史、拓扑完美、可直接用于有限元仿真的工业级实体。

Pointer-CAD 框架在表示层引入指针机制,将“选择”过程显式纳入生成框架,使模型能够通过引用 B-rep 实体执行编辑操作,更接近真实 CAD 工作流;在数据层,团队构建了包含约 57.5 万个 CAD 模型的高质量数据集,进一步夯实了模型训练与评测基础。
在多个基准测试中,Pointer-CAD 均取得了领先结果:在 Recap-DeepCAD 上,Pointer-CAD-1.5B 的 Segment Error 为 0.11,较 Text2CAD 下降约 75%;CD median 为3*10^-4,较 Text2CAD 下降约 91%。在支持倒角和圆角的 Recap-OmniCAD+ 上,其 CD mean 为 2.86*10^-3,显著优于 Text2CAD 与 CADmium,表明该方法在复杂 CAD 几何生成与拓扑准确性方面具备更强能力。
CAD 不是一个单靠语言生成就能解决的问题,它要求系统理解结构、约束、空间关系与操作逻辑。这也让这项工作的意义不止于论文本身,更体现了忆生科技创始团队在相关方向的深厚积累。
忆生科技致力于建构以记忆为中心的多模态世界模型,包括面向真实环境理解与交互的物理世界模型,以及支撑感知、运动与控制协同的物理本体模型。CAD 连接了几何结构、空间约束、对象关系与可执行操作,是打通理解世界、表达世界与作用于世界的重要拼图。
Pointer-CAD的发布不仅体现出忆生科技在CAD方向上的全栈能力,更标志着忆生科技在迈向世界模型的道路上迈出了重要一步。