4 天 6.8K Star!solo 开发者打造的 AI 漫剧工具 waoowaoo,小说一键变影视!

抖音、快手上火爆的短剧 / 漫剧,背后需要编剧、导演、演员、后期的完整团队,普通人想入局难如登天。而一个名为 waoowaoo(哇哦哇哦)的开源项目,4 天狂揽 6.8K GitHub Star,用 AI 打破了这一壁垒。更令人惊叹的是,这款号称 “首家工业级全流程 AI 影视生产平台” 的工具,竟出自一位 solo 开发者之手 —— 只需输入小说文本,AI 就能自动完成剧本分析、角色场景生成、分镜制作、配音合成,最终输出完整视频,让 “一个人创作出影视作品” 成为现实。

一、项目核心:小说文本到完整影视,全流程自动化

waoowaoo 的核心价值,是将影视制作的复杂流程(编剧→分镜→拍摄→后期→配音)全部 AI 化,用户无需任何专业技能,只需三步即可完成创作:

  1. 输入文本:粘贴小说章节或剧本内容(支持单集创作或整本小说智能分集);

  2. 一键启动:AI 自动解析文本,生成分镜、角色、场景并合成视频;

  3. 输出成品:直接获得带配音、带镜头运动的完整短剧 / 漫剧视频,支持多语言导出。

整个过程完全自动化,不用懂摄影、不用学剪辑、不用找演员,真正实现 “文本输入,影视输出” 的极简创作体验。

二、核心功能拆解:5 大模块,直击影视创作痛点

waoowaoo 的功能设计精准覆盖影视制作全流程,每个模块都针对性解决行业痛点:

1. AI 剧本分析:把小说变成可拍摄的剧本

写剧本是影视创作的第一道门槛,需要将小说的描写、对话、心理活动转化为场景和台词。waoowaoo 的 AI 剧本分析功能能自动完成这一过程:

  • 智能提取关键信息:从小说文本中识别角色(主角 / 配角、人物关系)、场景(地点、室内 / 室外、白天 / 黑夜)、剧情走向(开端、发展、高潮、结局);

  • 拆分分镜片段:自动将剧本拆分为多个分镜,标注每个片段的核心动作、对话,贴合故事节奏,避免生硬突兀;

  • 支持自定义调整:用户可在生成的剧本基础上修改角色设定、补充剧情细节,兼顾 AI 效率与创作自主性。

实测中,一段 “侯府祠堂家法” 的小说文本,被自动拆分为 5 个分镜片段,准确识别出老夫人、谢俞、莲儿等 4 个角色,还原了 “求情→对峙→施压” 的剧情脉络,台词提取精准,无需额外修改即可用于后续制作。

2. 角色 & 场景生成:解决 AI 创作的 “一致性” 难题

AI 绘画的通病是 “换场景就变脸”,而 waoowaoo 通过专属技术,攻克了角色与场景的一致性问题:

  • 角色形象统一:基于剧本分析为每个角色建立形象档案,使用 consistency 技术,确保角色在不同分镜、不同角度、不同光线下形象不变,不会出现 “认不出” 的情况;

  • 场景风格匹配:自动生成与剧情适配的场景(如侯府花园、祠堂、大牢等),风格统一无 “穿越感”,支持用户在资产中心自定义创建角色、场景,替换默认形象;

  • 资产库管理:生成的角色、场景会自动存入资产库,后续创作可直接复用,提升效率。

3. 分镜视频制作:AI 当导演,自动设计镜头语言

剧本和素材就绪后,waoowaoo 化身 “虚拟导演”,自动完成 “拍摄” 环节:

  • 分镜拆解:将每个剧本片段拆分为单个镜头,确定镜头类型(平视近景、俯拍全景等)和镜头运动(缓缓环绕、轻轻跟随、快速推拉等);

  • 画面生成与合成:根据镜头语言生成对应画面,自动拼接为连续视频片段,贴合剧情节奏(如对话用近景、场景转换用全景、冲突场景用快速跟随镜头);

  • 专业参数配置:内置摄影规则,支持设置光照方向(主光从左侧入射)、光线质感(硬光突出动态)、景深等专业参数,输出效果接近专业影视水准。

4. AI 配音:多角色、带情绪,支持多语言方言

视频有了画面,声音是灵魂。waoowaoo 的 AI 配音功能解决了 “找人配音难、成本高” 的问题:

  • 多角色音色区分:为每个角色分配专属音色,避免 “所有角色一个声音” 的尴尬;

  • 情绪适配:根据台词语境自动调整语调(如求情时的急切、对峙时的严肃),让配音更自然;

  • 多语言支持:不仅支持中文配音,还能切换英文等多语言,适配海外市场,界面也可一键切换中英文。

5. 多语言 & 灵活导出:适配不同创作需求

  • 双语界面:右上角一键切换中文 / 英文,国内创作者和海外用户都能轻松使用;

  • 多格式输出:支持短视频(9:16 竖屏)、常规影视(16:9 横屏)等多种比例,适配抖音、快手、视频号等不同平台;

  • 自定义扩展:支持导入自定义音频、修改角色音色、调整分镜顺序,满足个性化创作需求。

三、快速上手:Docker 一键部署,5 分钟启动创作

waoowaoo 的部署的门槛极低,只需安装 Docker Desktop,通过 Docker Compose 即可一键启动,无需复杂配置:

1. 部署步骤(复制即用)

bash

运行

# 1. 克隆仓库
git clone https://github.com/waoowaooAI/waoowaoo.git
cd waoowaoo

# 2. 一键启动(自动安装依赖、初始化数据库)
docker compose up -d

# 3. 访问使用
# 打开浏览器访问 http://localhost:13000

2. 创作流程

  1. 注册登录:访问本地地址后,注册账号并登录;

  2. 配置 API Key:进入 “设置中心”,选择文本模型、角色模型、视频模型等(支持 Doubao Seed、Gemini、Claude、MiniMax 等主流模型,配置有内置教程引导);

  3. 开始创作:选择 “智能文本分集” 或 “从第一集开始创作”,粘贴小说文本,点击 “开始分析”;

  4. 生成成品:等待 AI 完成剧本拆解、分镜制作、配音合成,直接下载完整视频。

3. 小技巧

  • 若 HTTP 模式卡顿,可安装 Caddy 启用 HTTPS:caddy run --config Caddyfile,访问https://localhost:1443

  • 更新版本:git pull && docker compose down && docker compose up -d --build,获取最新功能。

四、技术亮点:solo 开发者的生产级技术栈

别看是个人项目,waoowaoo 的技术选型堪称专业,完全按照生产级系统设计:

  • 前端:Next.js 15 + React 19,兼顾性能与可维护性;

  • 数据存储:MySQL + Prisma ORM,高效管理角色、场景、剧本等数据;

  • 队列系统:Redis + BullMQ,处理 AI 生成的异步任务,确保多环节并行高效;

  • 样式框架:Tailwind CSS v4,快速构建响应式界面;

  • 认证系统:NextAuth.js,保障账号安全。

这套技术组合是 2026 年前端开发的主流选型,既保证了项目的稳定性,也为后续扩展预留了空间,充分体现了开发者的专业水准。

五、项目现状与未来:beta 阶段但潜力巨大

目前 waoowaoo 处于 beta 测试阶段,开发者坦诚项目存在部分 bug 和不完善之处,但迭代速度极快,承诺 “更新会非常频繁”。其未来潜力值得期待:

  • 优势明显:开源免费、部署简单、全流程自动化,对比同类付费工具(如 Runway、Pika),更适合个人创作者和中小团队;

  • 现存不足:角色细节精细度有待提升,复杂剧情的分镜逻辑偶尔不够流畅,数据可视化类脚本(如表格转图表)效果不佳;

  • 发展方向:后续将优化 AI 生成精度、增加更多镜头语言选项、扩展更多模型支持,目标成为 “行业最强的 AI 影视工具”。

六、行业意义:AI 降低影视创作门槛,人人都是创作者

waoowaoo 的爆火,反映了市场对 “低门槛影视创作工具” 的迫切需求。它不仅让普通人有机会入局短剧 / 漫剧赛道,还为内容创作带来新可能:

  • 自媒体创作者:快速将公众号文章、小说片段转化为视频,丰富内容形式;

  • 小说作者:为作品制作影视化片段,提升传播力,甚至直接孵化 IP;

  • 教育领域:将课文、故事转化为动画视频,增强教学趣味性。

一个 solo 开发者,用 AI 技术打破了影视行业的高壁垒,4 天 6.8K Star 的成绩也证明了社区对这类工具的认可。虽然目前仍有打磨空间,但 waoowaoo 已经勾勒出 AI 影视创作的未来 —— 创作不再依赖团队和资源,只要有想法、有文本,就能用 AI 将其变为影视作品。

如果你对 AI 影视创作感兴趣,可前往 GitHub 关注项目(https://github.com/waoowaooAI/waoowaoo),蹲守最新更新,也可以直接部署体验,亲手感受 “小说一键变影视” 的神奇。

这工具听起来有点意思

4天6.8K星 太猛了

哇这个项目太牛了

深夜刷到
有点神
这工具绝了

这个确实挺厉害啊

我去这项目有点东西啊 全流程自动化也太狠了 不过角色一致性确实是大问题 期待后面迭代