---
name: seedream-image
description: |
  Generates Seedream 5.0/4.0 (即梦AI) image prompts and can call the API to generate
  images and auto-download to output/. Workflow: describe idea → agent outputs prompt
  for review → user confirms → agent runs generate.py. Covers text-to-image, image
  editing, multi-image fusion, character consistency, knowledge cards, posters,
  PPT backgrounds, e-commerce, avatars, group/storyboard. Use when the user mentions
  seedream, 即梦, jimeng, AI生图, 文生图, 图生图, seedream prompt, 提示词, 一键生图,
  knowledge card, poster design, 海报, 电商图, 角色一致性, or image generation.
license: MIT
metadata:
  author: 葱姜蒜
  version: "1.0.0"
  homepage: https://github.com/ppdbxdawj/ai-skills
  tags:
    - ai-image-generation
    - prompt-engineering
    - seedream
    - bytedance
    - jimeng
    - text-to-image
    - image-editing
    - character-consistency
    - chinese-ai
    - creative-tools
---

# Seedream Image Assistant | Seedream 即梦 图像助手

Seedream 5.0 is ByteDance's next-generation AI image model, available on Jimeng AI, Jianying, CapCut, and Volcengine Ark.

Seedream 5.0 是字节跳动推出的新一代 AI 图像生成模型，已在即梦AI、剪映、CapCut、火山方舟上线。

## Core Capabilities | 核心能力

| Capability | Description |
|------------|-------------|
| **Real-time Web Search** | Auto-fetches trending info when prompt contains timely keywords |
| **Multi-step Reasoning** | Interprets abstract concepts (e.g. "serene tech feel" → desaturated + clean lines + cold light) |
| **Multi-round Editing** | Iterative refinement: local edits, style transfer, element add/remove, text rendering |
| **High Resolution** | Native 2K, AI-enhanced 4K, 2-5 second generation |
| **Character Consistency** | Maintains face, clothing, pose across multiple images (storyboard-ready) |
| **Text Rendering** | 99%+ accuracy for Chinese/English text, use quotes for best results |

## 提示词结构

### 基础结构（文生图）

```
[主体描述] + [行为/动作] + [环境/背景] + [材质/质感] + [光影效果] + [构图要求] + [风格关键词]
```

- 主体+行为+环境用**自然语言**描述
- 风格/色彩/光影/构图用**短词**点缀
- 文字内容用引号标注，如：`"Hello World"`

### 四段式结构（进阶）

```
主体 → 环境 → 材质/质感 → 光影
```

### 编辑提示词公式

```
变化动作 + 变化对象 + 变化特征
示例："将骑士的头盔变为金色"
```

## 风格词汇库

### 写实摄影
- `写实电影剧照` `商业摄影` `纪实摄影` `超写实` `RAW 原片质感`
- 镜头：`85mm定焦` `35mm广角` `长焦压缩感` `鱼眼镜头`
- 光线：`伦勃朗光` `环形光` `分割光` `黄金时刻暖光` `蓝调时刻冷光` `霓虹光`

### 动漫/插画
- 日漫：`吉卜力动画风格` `新海诚风格` `日系少女漫画` `赛璐璐质感`
- 欧美：`美漫风格` `DC漫画风格` `欧美写实人物` `Pop Art波普艺术`
- 中国：`国潮插画` `水墨画风格` `中式工笔画` `赛博国风`
- 其他：`像素风格` `低多边形` `扁平插画` `厚涂油画` `水彩手绘`

### 设计/商业
- `极简主义` `包豪斯风格` `磨砂玻璃质感` `高质感金属` `赛博朋克`
- `电影海报级别` `品牌VI视觉` `信息图Infographic` `知识卡片`

### 光影修饰词
- `戏剧性侧光` `柔和漫射光` `高对比度` `低饱和度` `莫兰迪色调`
- `赛博霓虹` `暖橙调` `冷蓝调` `胶片颗粒感`

## 常用提示词模板

### 人物写实
```
[性别年龄外貌]，[服装描述]，[表情神态]，[环境背景]，85mm定焦，自然光，写实电影剧照风格，超高清，细节丰富
```

### 风景/场景
```
[场景描述]，[时间/天气]，[光线描述]，[构图]，[风格词]，电影感构图，8K超清
```

### 知识卡片（完整模板）
```
生成一张[格式/载体]风格的图像，向[目标受众]解释/展示"[核心概念]"。
图像需具备[风格特征A]、[风格特征B]和[排版要求C]，整体感觉类似于[熟悉参照物]。
```

### 品牌/海报（留白模板）
```
[视觉主体描述]，[材质描述]，[光影效果]，
所有视觉主体集中在画面[左/右]侧，为[右/左]侧留出大面积干净的背景区域，方便后期排版添加文字。
背景：[背景描述]
```

### 连续分镜（角色一致性）
```
参考[图1]的面部和发型，将其更改为[场景风格]装束，
生成N张连续的[场景描述]分镜图，[风格]，需要在一个场景中，连续动作。
```

### 电商产品
```
为这件[产品]创建[平台]风格的展示图，风格类似于[品牌参照]，
背景简洁，突出产品质感，专业商业摄影
```

## 场景速查

| 场景 | 提示词关键词 | 注意事项 |
|------|------------|---------|
| 头像 | `头像图标` `正方形构图` `纯色背景` | 指定风格参考图效果更好 |
| 知识卡片 | `信息图` `知识图谱` `排版清晰` | 说明目标受众和核心概念 |
| PPT背景 | `留白构图` `偏向[左/右]侧` `哑光背景` | 强调一侧留白供排版 |
| 角色Cos | `保持人脸不变` `写实质感服饰` `相同姿势` | 上传原图+目标角色图 |
| 手帐日记 | `手写字体` `纸张纹理` `拼贴风格` `米黄底色` | 告知日期和天气增加氛围 |
| 玻璃图标 | `磨砂玻璃质感` `渐变色` `C4D` `OC渲染` | 纯白背景+简洁构图 |
| 海报设计 | `电影海报级别` `戏剧光` `大面积留白` | 明确文字内容和位置 |
| 护身符/国潮 | `山海经` `国潮票据` `水墨` `篆刻印章` | 可加入"愿望"文字增加情感 |

## 进阶技巧

### 1. 联网触发
提示词中含时效词时自动联网：`2026年流行色` `最新款XX` `今年XX趋势` `米兰冬奥会`

### 2. 图像编辑
- **指定区域**："将图中[区域]替换成..."
- **风格迁移**："保持内容不变，改成[风格]"
- **元素控制**："为画面增加/移除[元素]"
- **光影调整**："将画面光影改为[光线名称]"
- **滤镜添加**："为画面添加[滤镜名]滤镜"
- **妆容修改**："为角色添加[妆容描述]"

### 3. 文字渲染
将需要生成的文字放入引号：`图片中央写着"创意无界"`

### 4. 构图控制
- 黄金分割：`三分法构图` `黄金螺旋`
- 视角：`俯视鸟瞰` `仰视` `正面平视` `45度斜角`
- 留白：`大量留白` `简洁背景` `主体偏[方向]`

### 5. 多图融合
最多支持 14 张参考图，融合时说明参考哪张图的哪个元素：
`参考图1的风格，图2的色调，图3的人物姿势`

### 6. 组图生成
触发词：`一系列` `组图` `生成N张连续的` `分镜图`

## 负向提示词写法

明确说明不需要的元素，放在提示词末尾：
- `背景简洁，不要杂乱元素`
- `保持人脸，不要改变面部特征`
- `不要文字水印`
- `不要过度曝光`

## 平台入口 | Platforms

| 平台 | URL | 说明 |
|------|-----|------|
| **即梦AI** Jimeng AI | https://jimeng.jianying.com/ | 主站，每日约 20 次免费 2K |
| **火山方舟** Volcengine Ark | https://console.volcengine.com/ark | 企业 API，支持 4K |
| **剪映** Jianying | App Store | AI 绘画 → Seedream 5.0 |
| **CapCut** (海外) | App Store | AI Image |

## API 生图脚本 | Image Generation Script

`generate.py` 调用即梦 4.0 API，图片自动下载到 `--output-dir`（默认 `output/`）。

### 环境准备

在 `generate.py` 同目录建 `.env` 写入 `VOLC_ACCESSKEY`、`VOLC_SECRETKEY`，或终端 export。脚本自动读取同目录 `.env`。`pip install -r requirements.txt`。

### 用法

```bash
# 文生图
python generate.py --prompt "一只猫在花园里玩耍，水彩风格"

# 图像编辑（输入参考图）
python generate.py --prompt "将背景换成海滩" --image-urls "https://example.com/photo.jpg"

# 指定分辨率 + 强制单图
python generate.py --prompt "电商主图，产品特写" --width 2560 --height 1440 --force-single

# 组图生成
python generate.py --prompt "生成4张分别关于春夏秋冬的盲盒组图"
```

### 在 Skill 工作流中使用

1. 按本 Skill 规则生成 prompt，用户确认。
2. 发起前软提示：默认 1 张，需多张（组图）则加 `--no-force-single` 或保留「组图」「一系列」等词。
3. 执行 `python generate.py --prompt "<confirmed_prompt>"`（组图时加 `--no-force-single`）。
4. 脚本轮询完成后图片在 `output/`，展示路径与 URL。

### 参数说明

| 参数 | 说明 |
|------|------|
| `--prompt` | 必填，提示词 |
| `--image-urls` | 输入参考图 URL（最多 10 张） |
| `--width` / `--height` | 指定输出宽高（需同时传），不传则智能适配 |
| `--size` | 输出面积（像素），默认 2K（2048×2048） |
| `--scale` | 文本影响程度 0~1（默认 0.5），越大文本越强 |
| `--force-single` | 只输出 1 张图（**默认**） |
| `--no-force-single` | 允许多张（组图），由模型根据提示词决定张数 |
| `--watermark` | 添加 AI 水印 |
| `--output-dir` | 生成图片保存目录（默认 output/），URL 与 base64 均会写入此处 |

## References | 参考文件

- Detailed examples & use cases → [examples.md](examples.md)
- Official docs, API params, size chart, full style dictionary → [reference.md](reference.md)
- T2I evaluation benchmarks & metrics → use **image-evaluation** skill ([reference](https://github.com/ppdbxdawj/ai-skills/tree/main/image-evaluation))
- Image generation script → [generate.py](generate.py)
- Dependencies → [requirements.txt](requirements.txt)