当行业还在为 OpenClaw 的部署流程争论不休时,奇绩 F25 创业者王子伯炎用一个反常识实验震惊了 AI 圈:他开发的MimiClaw,将原本需要依赖 Linux、Node.js 的 OpenClaw,直接跑在了一块仅售 5 美元的 ESP32-S3 芯片上 —— 没有操作系统,没有复杂依赖,纯 C 语言编写,插上 USB 供电、连上网线,通过 Telegram 就能发指令调用 AI 能力。
这个耗时仅 3 天(等快递 2 天、做 banner 半天、写代码半天)的项目,5 天内收获 2.7K Star、339 个 Fork,不仅引发了 “Agent 是否需要操作系统” 的深度讨论,更揭示了 AI Agent 落地的另一种可能:极致简化,回归核心。
一、核心颠覆:Agent 的本质,只是一个 for 循环
伯炎在拆解 OpenClaw 底层后发现,AI Agent 的核心运转逻辑远比想象中简单:用户发指令→模型思考→调用工具→获取结果→循环迭代,这本质是一个标准的 ReAct 循环。而这个流程,完全可以剥离所有冗余环节:
-
不需要操作系统的进程调度:Agent 的任务逻辑单一,无需多进程管理;
-
不需要复杂的文件系统:仅需本地存储少量记忆数据,简单存储即可满足;
-
不需要用户权限和图形界面:全程无需人工介入,自然无需这些面向人类的设计。
基于这个洞察,他将核心流程简化为 “一个 for 循环 + 一个 HTTP 网络模块”,用纯 C 语言写死并编译成固件,直接烧进 ESP32-S3 芯片。这颗拇指大小的芯片,仅需 0.5W 功率,就能 24 小时不间断运行,通过 Telegram 接收指令,调用云端大模型完成任务,还能跨重启保留本地记忆 —— 原本需要一台电脑才能实现的 Agent 能力,被压缩到了 5 美元的嵌入式设备上。
伯炎的初衷很直接:“羞辱那些在 Linux 开发板上重复部署 OpenClaw 的项目”。在他看来,很多项目只是换个载体重复已有功能,增量为零;而彻底去掉操作系统,让 Agent 核心逻辑在极简硬件上运行,才是真正有价值的创新。
二、赌局背后:浏览器会消失,屏幕是 “不放心” 的产物
MimiClaw 的极简设计,看似存在诸多 “缺陷”—— 没有浏览器操控能力,无法直接打开网页、填表单、爬数据。但这背后是伯炎对 Agent 时代的大胆预判:浏览器会消失,屏幕只是过渡产物。
他的逻辑很清晰:Agent 在浏览器上的所有操作,本质都是在获取底层数据,而网页只是给人类看的渲染层。现在给 Agent 套浏览器,只是因为很多服务还没提供 Agent 友好的接入方式。果不其然,在 MimiClaw 立项第二天,Cloudflare 就发布了网站转 Markdown 的服务,Google 也推出了 Web MCP 协议 —— 大厂们正在主动 “翻译” 网页,让 Agent 直接读取数据,浏览器这个中间层正在被跳过。
更颠覆的是他对 “屏幕” 的看法。当聊到有人为了同时管理多个 Agent,不惜租下邻居房间、贴满 163 寸 LED 屏时,伯炎直言:“以后不需要屏幕”。在他看来,人们需要屏幕盯着 Agent,本质是因为 Agent 还不够智能 —— 就像 Agent 出现前,人们需要手动搭 workflow、设检查点一样,屏幕是硬件层的 “我不放心”。
他设想的终局是:一个拇指大的设备,语音下达指令,Agent 在云端完成所有任务,仅用语音反馈结果,无需屏幕确认,无需人工介入。这个判断并非空想,正如 Anthropic CEO 所说:“不要优化模型现在做不到的事”,模型能力的持续进化,终将让这些过渡性的 “管控工具” 变得多余。
同时,MimiClaw 还预留了另一个核心潜力:ESP32 芯片天然支持外接传感器,几毛钱一个的温度、心率、空气质量模块焊上去,就能获取互联网上搜不到的物理世界数据。伯炎延续了 OpenClaw 创始人的判断:“80% 的 APP 会死,剩下的是带传感器的”,而嵌入式 Agent 正是连接物理世界与数字世界的最佳载体。
三、产品哲学:要么乘 100,要么零
MimiClaw 的爆火,也离不开伯炎独特的产品逻辑:在注意力稀缺的时代,产品要么带来 100 倍的体验提升,要么毫无价值。
在此之前,他曾做过一个叫 Memov 的项目,为 AI 编程提供版本控制,能记录 prompt、代码变化和上下文,功能和 GitHub 前 CEO 创业项目完全一致。但这个项目最终没能出圈,因为它只带来了 3 倍的体验提升 —— 在伯炎看来,过去比别人好 20% 就能抢占市场,现在体验乘 3 已经等于零,只有做到乘 100 的颠覆,才能被用户记住。
而 MimiClaw 正是 “乘 100” 的产物:把 Agent 从电脑压缩到 5 美元芯片,去掉操作系统,极致简化部署和使用流程,这种从 1 到 0 的极简创新,让从未接触过 ESP32 的普通用户都愿意下单面包板尝试,也让项目通过简单粗暴的推广方式走红 —— 用 1000 粉的推特小号,在所有 “如何部署 OpenClaw” 的评论区回复 “不要部署了,用 MimiClaw”,就带来了数十万次曝光。
这和他之前做的法语考试网站逻辑一致:竞品连数据库都没有,没有错题本、没有做题记录,他只是加上了这些基础功能,就实现了从 0 到 1 的体验飞跃,收获了极高的付费率。在他眼中,好产品不是复杂功能的堆砌,而是精准解决核心痛点,带来不可替代的体验升级。
四、争议与思考:Agent 时代,极简是未来吗?
MimiClaw 的爆火,也引发了行业对 Agent 发展方向的讨论。伯炎明确表示自己不相信 transformer 能在 10 年内实现 AGI——“它只是知道得多,不是真的比人聪明”。所以他放弃了读博时 “把模型压进嵌入式设备” 的研究,转而聚焦 “调用模型的循环”:模型在云端,硬件只需要承载核心逻辑和物理世界接口,这才是更贴近现实的落地路径。
但这种极简路线也面临质疑:去掉操作系统后,Agent 的扩展性如何保证?复杂任务的多工具协同能否实现?对此,伯炎的答案是 “聚焦核心”——Agent 的本质是 “做事”,而非 “兼容所有场景”。在模型能力持续变强的今天,与其追求大而全的兼容,不如把核心逻辑做透,让 Agent 以最低成本落地。
无论争议如何,MimiClaw 的意义已经超越了项目本身:它证明了 Agent 的核心逻辑可以极简到 “一个 for 循环 + 网络模块”,打破了 “Agent 必须依赖电脑” 的固有认知;它提出的 “浏览器消失、屏幕退场” 的预判,为 Agent 的未来形态提供了全新视角;而它 “要么乘 100,要么零” 的产品哲学,也为 AI 时代的创业者提供了重要启示。
在 AI Agent 还在探索落地形态的今天,MimiClaw 就像一颗石子,投入了技术的湖面。它未必是 Agent 的最终形态,但它的极简革命,正在让行业重新思考:Agent 的核心到底是什么?未来的 AI 交互,应该是复杂还是简单?或许正如伯炎所说,当模型足够智能,所有多余的环节都会被剥离,只留下最本质的 “指令 - 执行” 循环。

