当生成式 AI 聚焦 “大脑进化” 时,一家不研发模型的公司却凭底层技术崛起:成立于 2021 年的 LiveKit,在短短 10 个月内估值从 4500 万美元飙升至 10 亿美元,成为 AI 时代实时音视频交互的核心基础设施。它就像 AI 的 “中枢神经系统”,连接大模型 “大脑” 与物理世界 “终端”,用低于 100 毫秒的延迟,解决了 AI 与人无缝交流的 “最后一公里” 难题。
团队基因:开源先行,技术与商业双驱动
LiveKit 的崛起,始于创始人对开发者痛点的深刻洞察,更源于团队深厚的技术与商业基因:
-
创始人背景:CEO Russ d’Sa 曾任职于 Stripe、ThoughtWorks,深谙开发者工具的商业化逻辑;CTO David Zhao 是分布式系统与实时流媒体专家,为技术落地奠定核心基础。两人早在 2012 年就开始合作,2019 年将共同创办的 Evie Labs 出售给 Medium,创业经验丰富。
-
开源基因:2021 年以开源项目形式亮相 GitHub,基于 Go 语言和 Pion WebRTC 实现,凭借 “比原生 WebRTC 更易用、更强大” 的工具链,快速积累 1.7 万 Star,构建起 10 万 + 开发者的 Slack 社区。开源模式不仅打磨了代码健壮性,更让其协议在 AI 爆发前就成为行业事实标准。
-
商业化路径:采用 “开源工具包 + LiveKit Cloud 托管服务” 模式,既降低开发者接入门槛,又通过企业级服务实现营收,形成 “社区 - 产品 - 商业” 的正向循环。
核心能力:三大技术突破,定义实时交互标准
LiveKit 的核心竞争力,在于对 WebRTC 技术的深度优化与 AI 场景的专属适配,三大功能构建起难以逾越的壁垒:
1. 超低延迟传输:压缩至人类感知极限
实时交互的核心是 “无延迟感”。LiveKit 通过优化 WebRTC 堆栈,将音视频延迟压缩至 100 毫秒以内 —— 这一数值低于人类感知阈值,是实现自然对话、实时反馈的关键。对比传统直播 1-3 秒的延迟,LiveKit 的技术突破让 AI 语音交互从 “问答式” 升级为 “对话式”,为 ChatGPT 语音模式、特斯拉机器人视觉反馈等场景提供了基础。
2. AI Agent 编排:打通 “大脑 - 感官 - 输出” 闭环
这是 LiveKit 区别于传统音视频厂商的核心差异。它提供专属框架,让开发者能轻松整合 LLM(大脑)、语音转文字(耳朵)、文字转语音(嘴巴)与实时流,实现 AI Agent 的端到端实时交互。例如,在客服场景中,LiveKit 可实时传输用户语音,同步转写至大模型生成回复,再将文字转化为语音反馈,全程无卡顿衔接。
3. 多端适配与极端稳定性
支持 Web、移动端、硬件机器人等全终端无缝运行,更能应对弱网环境下的丢包问题。这种稳定性使其突破消费级场景,进入 911 紧急服务、远程心理治疗等关键领域 —— 这些场景对 “不可中断” 的要求极高,也为 LiveKit 构建了极强的品牌护城河。
产业链定位:AI 交互的 “必经之路”
在 AI 产业链中,LiveKit 占据了独特且稳固的 “中枢” 位置,成为连接上下游的关键枢纽:
-
上游对接:适配 Nvidia 算力,以及 OpenAI、Anthropic、xAI 等主流大模型,无需关注模型差异,即可实现实时交互适配;
-
中游中枢:不参与模型推理,专注 “信号搬运与处理”—— 将大模型的 Token 实时转化为音视频流,同时处理对话打断、回声消除、语音检测等交互细节;
-
下游落地:覆盖消费级(ChatGPT 语音、视频会议)、工业级(机器人实时控制)、公共服务级(911 紧急热线)等多场景,每年支持数十亿次通话,客户包括 Salesforce、Spotify、特斯拉等巨头。
更关键的是,LiveKit 已成为 OpenAI 等巨头的官方合作伙伴,与 Agora、Twilio 共同构成全球实时音视频 API 的核心阵营,进一步巩固了行业标准地位。
10 亿估值背后:三大核心价值逻辑
LiveKit 的估值爆发,并非偶然,而是技术壁垒、场景价值与行业标准三重优势的叠加:
-
极高的工程壁垒:实时音视频是公认的 “坑多复杂” 领域,涉及编解码、网络传输、设备适配等多重难题。LiveKit 通过开源模式,在全球开发者的边缘案例中持续打磨代码,形成 “越用越稳定” 的复利效应,技术门槛远超普通创业公司。
-
高价值场景的深度绑定:不同于普通音视频工具聚焦娱乐场景,LiveKit 切入 911 紧急服务、远程医疗等 “不可替代” 场景。这些场景付费意愿强、粘性高,且对稳定性要求严苛,形成了难以撼动的品牌壁垒。
-
从工具到行业标准的跃迁:随着 OpenAI 等巨头的背书与采用,LiveKit 正在成为 AI 实时交互的 “标配”。对开发者而言,选择 LiveKit 意味着兼容更多模型、设备与场景,这种 “路径依赖” 让其在竞争中占据绝对优势。
行业启示:AI 落地的 “基础设施决胜论”
LiveKit 的崛起,印证了一个关键规律:当 AI 技术从实验室走向物理世界,底层基础设施的支撑能力,往往比核心算法的微小差距更重要。大模型解决 “能思考” 的问题,而 LiveKit 解决 “能交互” 的问题 —— 没有实时、稳定的传输通道,再强大的 AI 也无法实现自然的人机协作。
未来,随着 AI Agent、机器人、元宇宙等场景的爆发,实时音视频交互的需求将持续增长。LiveKit 的估值故事,才刚刚开始:它不赌某一个模型的胜负,而是押注 “所有 AI 都需要实时交互” 的必然趋势。正如神经系统是人体的核心枢纽,LiveKit 也正在成为 AI 时代不可或缺的底层支撑,其影响力将随着 AI 的普及持续扩张。


