MoltBot(原名 Clawdbot)爆火后,创始人 Peter Steinberger 首次公开采访就抛出重磅观点,直击当前软件交互与形态的核心痛点,其激进又极具前瞻性的思考,给社区开发者和 AI 创业者带来全新启发 ——APP 的时代正在落幕,Agent 驱动的「极简交互」将成为未来。
一、核心洞察:CLI 才是 AI 的 “母语”,GUI 是效率枷锁
Peter 认为,当前 AI 与人类的交互方式存在本质矛盾,而命令行(CLI)才是最适配 AI 的原生接口:
-
GUI(图形用户界面)是为人类 “生物局限性” 设计的,按钮、图标、拖拽等操作,本质是人类无法高效处理纯文本流的妥协;
-
CLI(命令行界面)输入输出纯粹、逻辑直接,AI 解析 curl 指令等字符参数如同本能,而处理复杂网页 DOM 结构反而如同 “折磨”;
-
让 AI 通过 GUI 交互,就像让顶级同声传译用手势沟通 —— 虽能靠海量算力弥补,但无疑是对资源的巨大浪费,这也是有人调侃 “AI 是老黄卖 GPU 的噱头” 的核心原因。
二、软件 “液化”:复杂操作坍缩为一句话、一张图
Peter 提出 “软件液化”(Liquefaction)概念,描绘了未来软件的终极形态:
-
所有复杂的 UI、多层级操作,最终都会简化为一个对话框,用户无需学习任何软件使用逻辑,只需用自然语言或图片触发需求;
-
场景实例:无需打开健身 APP 手动记录饮食,拍一张汉堡照片发给 Agent,它就能自动关联你的地理位置、进食时间、过往体检指标,后台同步完成数据更新;
-
核心逻辑:Agent 将潜入系统的每一个 “毛细血管”,代替用户完成所有繁琐琐事,人类只需专注于 “提出需求”,无需关心 “如何实现”。
三、激进突破:屏幕可见即接管,打破大厂 API 壁垒
这是 Peter 方案中最具争议也最实用的部分,完美解决了开发者普遍面临的 API 限制痛点:
-
痛点直指:Slack、Notion 等 SaaS 巨头的 API 极其吝啬,限制导出频率、隐藏核心功能、对高级接口收费,严重束缚 Agent 的能力边界;
-
破局方案:通过 Applescript 命令让 Agent 读取屏幕像素并模拟点击,实现 “屏幕上能看到的,就能接管”—— 绕开官方 API 限制,直接击穿大厂建立的计费墙;
-
开发者价值:对独立开发者和创业团队而言,这一思路提供了低成本突破巨头生态封锁的可能,无需依赖官方接口就能实现跨平台、跨软件的自动化操作。
Peter 的观点看似激进,却精准命中了 AI 时代软件发展的核心趋势:交互极简化、操作自动化、边界无感化。对社区开发者而言,这不仅是对未来产品形态的想象,更提供了当下可落地的技术思路 —— 聚焦 Agent 的核心能力,打破传统软件的交互与权限束缚,或许就是下一个创业风口。

