# vocabulary-video-pipeline 基于 [Remotion](https://www.remotion.dev) 的词汇视频自动化生成 skill。输入一个英文单词,自动生成带有中文讲解、TTS 音频和动态视觉效果的教育视频。 ## 效果预览


## 为什么做这个 skill 面向中小学生的英文视频内容通常需要: - 每个单词配一份中文叙事讲解 - 视觉元素要跟着音频节奏出现 - 字体、颜色、动画要统一和高质量 这个 skill 把上述流程打包成一个自动化流水线,只需给一个单词,就能走完草稿 → TTS → 渲染 → 上传 → 报告的全部流程。 ## 核心特点 - **模板订单制**(Template Order System):每个新单词自动匹配最优场景组合,库里没有时会触发新模板开发 - **TTS 节奏同步**:基于静音检测自动分割 audio beats,视觉元素与讲述节奏完美同步 - **多元模板库**:Hero 入题、词源链、氛围场景、名言引用、问答卡片、总结收尾等 - **成本透明**:每次生成自动统计 TTS 字符数与成本(约 ¥0.3 / 千字) ## 工作流 ```mermaid graph LR A[输入单词] --> B[diagnose 诊断] B --> C[生成草稿 JSON] C --> D[TTS 合成] D --> E[静音检测分 beats] E --> F[Remotion 渲染 MP4] F --> G[飞书云盘上传] G --> H[成本报告] ``` ## 前提条件 1. 已克隆 [vocabulary-video-pipeline](https://github.com/dracohu2025-cloud/vocabulary-video-pipeline) 项目到本地 2. 已安装 Node.js、npm、Python 3 3. 已安装 Python 依赖:`pip install pydub requests` 4. 已配置火山引擎 TTS 的 `.env` 参数 5. 已安装 `lark-cli` 并登录(用于飞书上传) ## 快速开始 ### 1. 配置项目路径 ```bash export VOCAB_VIDEO_PROJECT_ROOT=/path/to/vocabulary-video-pipeline ``` 如果不设置,脚本会自动尝试常见路径。 ### 2. 一键生成视频 ```bash python3 scripts/generate_word_video.py --word breakfast ``` 运行后会自动执行: 1. 诊断单词并生成草稿 2. 合成 TTS 并分割节奏 3. 渲染视频 4. 上传飞书云盘 5. 打印成本报告 ### 3. 分阶段使用 只生成草稿(方便手动修改文案): ```bash python3 scripts/generate_word_video.py --word breakfast --draft-only ``` 只到音频节奏为止: ```bash python3 scripts/generate_word_video.py --word breakfast --audio-only ``` 跳过渲染和上传: ```bash python3 scripts/generate_word_video.py --word breakfast --skip-render --skip-upload ``` ## 模板库一览 | 场景 | 类型 | 说明 | |------|------|------| | `hero-word` | 入题 | 展示单词、音标、标签 | | `origin-chain` | 词源 | 展示词汇历史演变链 | | `meaning-compare` | 辨析 | 对比近义词或概念 | | `full-screen-mood` | 氛围 | 情绪化场景描述 | | `quote-page` | 引用 | 英文名句及中文翻译 | | `answer-cards` | 问答 | 三个问题卡片式解答 | | `ending-summary` | 总结 | 公式 + 要点 + 结语 | ## 常见问题 **Q: 生成草稿后想改文案怎么办?** A: 草稿在项目的 `data/{word}-draft.json` 中,可以直接手动修改后重新运行 `generate_word_video.py`。 **Q: TTS 成本是多少?** A: 使用火山引擎/豆包 TTS 2.0 时,约 ¥0.3 / 千字符。每次生成后会自动统计并打印。 **Q: 渲染一个视频要多久?** A: 一分钟左右的视频约需 10-15 分钟,建议后台运行。 ## 相关仓库 - [主项目: vocabulary-video-pipeline](https://github.com/dracohu2025-cloud/vocabulary-video-pipeline) - [技能收藏: Draco-Skills-Collection](https://github.com/dracohu2025-cloud/draco-skills-collection)