10 亿美元融资 + 估值 50 亿!AI 教母李飞飞押注空间智能,开启 AI “空间时代”!

2026 年 2 月 18 日,“AI 教母” 李飞飞创立的 World Labs 宣布完成 10 亿美元新一轮融资,估值飙升至 50 亿美元 —— 距离其 2024 年 11 月 10 亿美元估值的 B 轮融资,仅过去 15 个月,估值实现 5 倍暴涨。在大语言模型(LLM)占据 AI 赛道 C 位的当下,李飞飞剑走偏锋押注 “空间智能”,吸引 Autodesk 领投 2 亿美元,NVIDIA、AMD、a16z 等巨头纷纷入局。这场融资不仅是对 “AI 教母” 个人光环的认可,更标志着资本对 “世界模型” 赛道的集体重估,AI 行业正从 “文字世界” 向 “空间世界” 加速转型。

一、赛道颠覆:为什么是空间智能,而非 LLM?

在 LLM 统治 AI 创业浪潮的背景下,李飞飞的选择并非偶然。她直言:“LLM 是对世界的有损压缩,而世界模型才是 AI 通往更高级智能的关键,没有空间智能的 AGI 是不完整的。”

1. 空间智能的核心:让 AI 理解三维物理世界

所谓空间智能,本质是让 AI 具备在三维世界中感知、理解、推理、创造与交互的能力,核心是构建能映射真实世界规则(几何规律、物理法则、动态逻辑)的 “世界模型”。当前 LLM 虽擅长处理抽象文本知识,却如同 “在黑暗中行走”,缺乏对物理世界的真实认知 —— 无法判断物体摆放的稳定性,也无法模拟场景中的动态交互,而空间智能正是要填补这一核心缺口。

2. 三大核心突破,重构 AI 与世界的交互

与传统 AI 相比,World Labs 的世界模型实现了从二维到三维的跨越,具备三大核心优势:

  • 生成性突破:生成的 3D 场景严格遵循物理规律,比如物体坠落符合重力法则,光影变化契合光学逻辑,而非单纯的像素拼接;

  • 多模态融合:无缝对接文本、图像、视频、深度图等多类信号,无论是输入文字描述,还是上传多角度照片,都能生成一致的 3D 空间;

  • 交互式体验:支持自由导航、实时编辑与动态推演,用户可拖拽场景中的物体调整位置,甚至模拟场景中的动态变化(如开门、物体移动)。

NVIDIA CEO 黄仁勋的评价精准点明其价值:“世界基础模型对物理 AI,就像大语言模型对生成 AI 那样基础。” 这意味着,空间智能可能成为下一代 AI 应用的底层操作系统。

二、资本逻辑:“产业 + 财务” 闭环,构建不可复制的生态壁垒

本次融资的资本结构极具战略深意,形成了 “算法 - 算力 - 应用” 的完美闭环,为 World Labs 构建了难以复制的竞争优势:

表格

资本类型 代表玩家 核心贡献
产业资本 Autodesk(领投) 提供设计软件场景(AutoCAD 覆盖建筑、工业等领域),实现技术落地;双方深度整合,用户可先用 World Labs 构建布局草图,再用 Autodesk 细化设计
算力资本 NVIDIA、AMD 提供算力支撑(世界模型需海量计算模拟几何与物理);AMD 与 World Labs 深度合作,在 Instinct MI325X 芯片 + ROCm 软件栈支持下,推理性能提升超 4 倍
财务资本 a16z、Fidelity 提供资金与投后服务,认可差异化赛道价值,推动技术规模化商用

这种 “产业资本提供场景、算力资本保障性能、财务资本注入资金” 的组合,让 World Labs 从诞生之初就避开了 “技术孤岛” 陷阱,直接切入商业化落地快车道。

三、技术根基:从斯坦福实验室到商业产品的跨越

World Labs 的崛起,源于李飞飞在斯坦福大学十余年的学术积累,以及核心团队的顶尖科研背景,实现了从 “实验室理论” 到 “商业产品” 的成功转化。

1. 学术源头:三大斯坦福项目奠定基础

World Labs 的技术并非空中楼阁,而是源于李飞飞在斯坦福领导的三个关键研究:

  • 2017-2020 年 “场景图” 研究:首次将图像中的物体关系结构化,让 AI “看懂” 物体间的关联;

  • 2020-2022 年 “Interaction Hotspots” 项目:实现 AI 预测人类与物体的互动方式,比如判断开门的把手位置与发力方向;

  • 2022-2023 年 “VoxPoser” 突破:结合 LLM 与视觉模型,根据自然语言指令生成机器人的三维行动路径,打通 “语言 - 空间 - 行动” 的链路。

李飞飞坦言:“学术研究解决了‘是否可能’的问题,而 World Labs 要解决‘如何规模化、产品化’的挑战。”

2. 核心产品 Marble:专业级 3D 空间生成工具

World Labs 的核心产品 Marble,正是学术成果商业化的核心载体。它能从文本、图像或视频输入,快速生成空间一致、高保真的 3D 世界,且支持 USD 等标准 3D 格式输出 —— 这意味着生成的内容可直接导入 Unity、虚幻引擎等专业工具,或 Apple Vision Pro 等 VR 设备,而非 “黑盒” 式的不可编辑结果。

其底层采用高斯溅射(Gaussian Splatting)技术,通过数亿个半透明粒子模拟物体光学特性,平衡细节与效率;同时支持 “结构 - 风格解耦编辑”,用户可先搭建空间框架,再定义视觉风格,大幅降低 3D 内容创作门槛。

3. 明星团队:集结计算机视觉顶尖力量

除李飞飞外,联合创始团队堪称 “梦幻阵容”:

  • Justin Johnson:神经风格迁移提出者,奠定 AI 艺术创作的技术基础;

  • Ben Mildenhall:NeRF(神经辐射场)第一作者,重构 3D 场景重建技术;

  • Christoph Lassner:Pulsar 创始人,在实时渲染与空间交互领域深耕多年。

这些研究者覆盖了从像素建模到场景重建、从图像理解到空间推理的全链条,构成了技术壁垒的核心。

四、估值密码:50 亿美元背后的四大支撑

一家成立不到两年的公司,能支撑 50 亿美元估值,核心源于技术、商业化、团队与市场时机的多重共振:

1. 技术壁垒:不可替代的世界模型能力

Marble 的 3D 生成精度与工业级兼容性,目前尚无直接竞品。其生成的场景既符合物理规律,又能无缝对接现有专业工具链,解决了 “AI 生成 3D 内容无法落地应用” 的行业痛点。

2. 商业化路径清晰:B2B 生态合作模式

与 Autodesk 的深度整合,让 World Labs 直接切入建筑设计、工业制造、游戏开发等高价值场景。这种 “AI 工具 + 专业软件” 的合作模式,无需从零教育市场,能快速实现商业变现。

3. 团队溢价:李飞飞的行业标杆效应

李飞飞的学术地位与行业影响力,成为资本信任的核心背书。她是斯坦福大学首位 AI 研究院院长、美国 “三院院士”,2025 年当选《时代》周刊年度人物,其在 ImageNet 项目中推动深度学习革命的履历,让资本对其技术判断力充满信心。

4. 市场时机:世界模型赛道爆发前夜

2026 年初至今,已有超 13 亿美元融资流入世界模型初创企业,赛道快速升温。当前主要玩家包括 Yann LeCun 创立的 AMI Labs、World Labs 及 Google DeepMind 的 Genie 3 项目,而 World Labs 是首个实现商业化闭环的玩家,抢占了先发优势。

五、对国内创业者的五大启示

World Labs 的案例,为国内硬科技创业者提供了极具价值的参考:

1. 技术选择:避开红海,拥抱差异化赛道

在 LLM 赛道拥挤的当下,李飞飞选择空间智能这一 “无人区”,证明硬科技创业的核心是 “以学术深度重构产业价值”,而非盲目跟风。

2. 资本结构:构建 “产业 + 财务” 协同网络

主动对接产业龙头战投与地方产业基金,形成 “政府 - 产业 - 资本” 三角协同,既能获得资金,又能获取场景与资源,避免技术与市场脱节。

3. 成果转化:搭建学术到商业的系统能力

科学家创业的最大挑战并非技术,而是将实验室成果规模化、产品化。需建立专门的产品团队与市场团队,让技术适配产业需求,而非让产业适应技术。

4. 生态构建:放弃单点突破,打造平台型生态

World Labs 与 Autodesk 的绑定,证明生态合作是技术快速落地的关键。国内企业应主动链接产业链上下游,打造覆盖 “技术 - 工具 - 场景” 的生态图谱。

5. 长期主义:硬科技需要 “十年磨一剑” 的耐心

空间智能的技术积累源于李飞飞十余年的学术沉淀,证明硬科技创新无法急于求成。创业者需 “坚持活着,不下牌桌”,在无人区中持续深耕,等待赛道爆发。

结语:AI 从 “看懂文字” 到 “理解空间” 的跨越

World Labs 的 10 亿美元融资,不仅是一家独角兽的崛起,更标志着 AI 行业的格局变迁 —— 当 LLM 解决了 “理解文字” 的问题后,空间智能正成为通往 AGI 的下一站。李飞飞的押注,本质是赌 AI 的未来必然要从抽象文本世界,走向真实的三维物理世界。

当 AI 能感知空间、模拟物理、预测动态,它将在建筑设计、工业制造、机器人、VR/AR 等领域引发革命性变革。而 World Labs 的崛起,只是这场变革的开始。对于国内创业者而言,真正的机会不在于模仿 LLM 的红海竞争,而在于像李飞飞那样,在无人区中找到技术深度、产业痛点与生态宽度的交汇点,用长期主义构建真正的技术壁垒。

这技术听着有点意思

李飞飞押注空间智能果然没错

夜猫子看到这消息直接清醒了

这个估值涨得也太快了

空间智能确实有潜力

空间智能这个方向确实有东西

飞飞这波押注真狠
空间智能确实比纯文本有意思