融资 10 亿!前华为麒麟架构师再创奇迹,国产 AI 芯片用 “解耦” 架构定义下一代算力

当英伟达以 200 亿美元天价收购 Groq,搅动全球 AI 算力格局时,中国芯片界的领军人物梁军带着全新创业公司「上海昉擎科技」,完成了 10 亿元 Pre-A3 轮融资,向世界交出了一份差异化的算力破局方案。这位曾主导华为麒麟 SoC 研发、执掌寒武纪技术架构的行业大咖,此次不再追求单一芯片的参数突破,而是以全球首创的 “上下文相关与上下文无关解耦” 分布式计算架构,重构 AI 计算系统范式,目标直指 Agent 时代对低时延、低成本 token 的核心需求,试图定义属于中国的下一代 AI 硬件标准。

此次融资新引入国开科创、钧山资本、建发新兴投资等投资方,华业天成、蔚来资本等老股东超额加注,近三个月内完成多轮融资的亮眼表现,既印证了资本市场对梁军技术判断力的高度认可,更彰显了对昉擎全新架构路线的强烈信心。

领军者梁军:从麒麟到寒武纪,再攀算力新高峰

在国产 AI 算力突围的赛道上,梁军的履历堪称 “行业标杆”—— 深耕芯片领域二十余载,每一步都踩在国产芯片发展的关键节点,兼具顶尖技术品味与产业落地能力。

早年任职华为海思期间,他以总架构师身份主导麒麟 SoC 芯片研发,亲手搭建核心技术体系,全球首次在海量发货的手机 SoC 中集成 NPU,推动国产芯片实现从追赶至突破的关键跨越;2017 年加入寒武纪后,出任 CTO 主导首款 7nm AI 训练芯片思元 290 及后续系列产品,成功将 AI 芯片技术从实验室推向规模化应用场景。

如今再次创业,梁军跳出了 “造一款更牛的芯片” 的传统思维,站在更高维度定义 AI 时代的计算系统范式。这种 “技术 + 产业” 的双重积淀,让他精准洞察到行业痛点:随着 OpenClaw 等 Agent 应用爆火,AI 计算正从云端向边缘深度渗透,分布式与 C 端场景化趋势愈发明显,低时延、低成本 token 成为核心刚需,而当前以英伟达 GPGPU 为主导的架构,已难以满足这一变革需求。

架构革命:“解耦” 设计,破解 Transformer 核心痛点

昉擎科技的技术内核,是一套全球首创的 **“上下文相关(context aware)与上下文无关(context free)解耦” 分布式计算架构 **,直指 Transformer 模型的效率瓶颈,更契合计算范式从 “以计算为中心” 向 “以 Memory 为中心” 的转移趋势。

在传统 Transformer 设计中,负责记忆与上下文的注意力机制(Attention),与负责逻辑和知识的前馈神经网络(FNN)被串联在同一层,导致两种不同计算需求在同一芯片上竞争资源,严重制约效率。而昉擎的解法堪称颠覆性:

  1. 彻底解耦分离:将 FNN 与 Attention 拆分为两个独立模块,分配给最适配的硬件架构进行分布式处理,通过明确定义的接口通信;

  2. 多维扩展能力:系统扩展从单一维度升级为多维度,其中 “上下文相关模块” 侧重输入输出处理,类似冯诺伊曼架构的处理器;“上下文无关模块” 聚焦权重处理,更像具备计算语义与通信属性的新型 Memory(传统 Memory 仅含容量、带宽两个属性,新型 Memory 新增两个维度);

  3. 低延迟适配:这种分离式架构天生适配 Agent 应用需求,搭建的推理系统能精准匹配低时延、低成本的核心诉求,有望成为产业新热点。

这一架构思路与英伟达最新推出的 Rubin CPX 芯片 “分离式推理架构” 异曲同工,后者通过拆分 “上下文理解” 与 “内容生成” 阶段,实现百万级 token 上下文推理能力,侧面印证了分离式架构的技术前瞻性。

算力普惠:端侧革命,让每个人都有 “大模型大脑”

梁军的蓝图不止于云端算力突围,更要通过分布式架构延伸至端侧,彻底改变 AI 硬件生态,让大模型普惠化真正落地。

家庭 AI 计算中心:让智能设备集体 “升级”

当前电视、空调、扫地机器人等家用智能设备,虽内置小芯片却受限于算力,无法运行轻量大模型。昉擎的解决方案是打造一个不起眼的 “家庭 AI 计算中心”:所有家用设备的小芯片仅负责将物理世界输入 token 化、将模型输出转换为物理信号,而复杂的 AI 推理则由中心的分离式架构系统统一处理。通过 Wi-Fi 连接,家中所有设备均可调用大模型能力,让 AI 算力随处可用。

个人智能中枢:名片大小的 “随身算力载体”

针对智能手表、AR 眼镜等微型穿戴设备的体积、功耗限制,昉擎构想了一枚名片大小的 “个人计算平台”:穿戴设备仅负责数据采集与信号转换,复杂推理全部交由这张 “卡片” 完成。未来,它不仅是算力载体,更可集成数字身份、健康档案、AI Agent 人格,成为新时代的 “数字身份证”,让每个人都能拥有专属的 “大模型大脑”。

这一构想与 6G 时代 “终端 + 边缘 + 云” 的三层架构趋势高度契合 —— 随着端侧 AI 需求激增,上行数据量爆发式增长,昉擎的分离式架构可实现推理任务的灵活拆分,将终端难以承载的计算任务高效处理,为消费级终端、汽车等领域带来全新机遇。

差异化破局:不拼参数,定义下一代计算范式

当前全球 AI 算力市场虽由英伟达主导,但变革的暗流已涌动:Groq 凭可重构计算流处理器估值飙升至 200 亿美元,Cerebras 以晶圆级芯片实现超大规模并行计算,Tenstorrent 靠 “数据流 + RISC-V” 混合架构吸引行业大咖加盟。

而昉擎选择了一条更具颠覆性的差异化路线:不迷信先进制程,不比拼 TOPS 数字,而是通过重新组织计算、存储与通信的关系,释放前所未有的效率与灵活性。这种从底层逻辑出发的范式重构,不仅避开了与国际巨头的正面竞争,更精准切中了 Agent 时代的核心需求,为国产 AI 算力开辟了全新赛道。

结语:中国原创架构,角逐全球算力话语权

从华为麒麟到寒武纪,再到如今的昉擎科技,梁军始终在攀登算力高峰。这一次,他的目标不再是追赶现有技术,而是定义尚未被开拓的新领域。10 亿元融资的注入,将加速这套 “解耦” 架构的产业化落地,推动端侧 AI 革命的到来。

当 OpenClaw 带动 Mac mini 热销,预示着 AI 硬件将成为智能化社会的基础设施,昉擎的出现恰逢其时。这场静水深流的算力革命,不仅是简单的国产替代,更是中国芯片企业以原创架构角逐全球算力话语权的开始。未来,随着 “家庭 AI 计算中心”“个人智能中枢” 的落地,AI 有望真正走进千家万户,融入每个人的数字生命。

梁军大佬思路确实牛

这架构思路很硬核啊 解耦设计直击Transformer效率痛点 梁军的产业视野确实超前 端侧普惠化路径也很清晰

这架构思路有点意思啊

梁军这路线选得挺有意思

梁军这次跳出参数竞赛的思路挺有意思,解耦架构确实切中了Agent应用的低时延痛点。如果真能把家庭AI计算中心做起来,市场想象空间不小。

牛啊 架构创新才是真突破