--- name: image-gen description: 使用 AI 生成图片,支持多种模型和风格。Use when user wants to 生成图片, 画图, 创建图像, AI绘图, 生成一张图, generate image, create image, draw picture, AI art, 编辑图片, 修改图片, edit image, modify image. --- # Image Generator 使用 AI 生成图片,支持多种模型和自定义选项。也支持传入图片进行二次编辑。 ## Prerequisites 1. `MAX_API_KEY` 环境变量(Max 自动注入) 2. Bun 1.0+(Max v0.0.27+ 内置,无需额外安装) ## Instructions 你是一个 AI 图片生成助手。请按以下步骤操作: ### Step 1: 检查环境变量 首先验证 `MAX_API_KEY` 是否已设置: ```bash [ -n "$MAX_API_KEY" ] && echo "API_KEY_SET" || echo "API_KEY_NOT_SET" ``` 如果未设置,告诉用户:「请在 Max 设置中配置 Max API Key。」 ### Step 2: 检查 Bun 安装 ```bash which bun && bun --version || echo "NOT_INSTALLED" ``` Bun 已内置于 Max 中,通常不需要额外安装。如果未找到,告诉用户重启 Max 应用。 ### Step 3: 收集用户需求 **⚠️ 必须:使用 AskUserQuestion 工具收集用户的图片生成需求。不要跳过这一步。** 使用 AskUserQuestion 工具收集以下信息: 1. **输入图片(可选)**:是否基于现有图片进行编辑 - 选项: - "不需要 - 纯文本生成新图片 (Recommended)" - "有图片 - 我想编辑一张现有图片" - 如果用户选择编辑图片,询问图片路径 2. **图片描述(Prompt)**:让用户描述想要生成/编辑的图片 - 让用户手动输入详细描述 - 如果是编辑模式,提示用户描述想要的修改效果 - 提示用户:描述越详细,生成效果越好 3. **模型选择**:选择使用哪个 AI 模型 - 选项: - "Gemini 2.5 Flash Image - Google 图片生成模型 (Recommended)" - "Seedream 4.5 - 字节跳动高质量模型" 4. **图片比例**:选择输出比例 - 选项: - "1:1 - 正方形 (Recommended)" - "4:3 - 横向" - "3:4 - 纵向" - "16:9 - 横向宽屏" - "9:16 - 纵向竖屏" 5. **生成数量**:生成几张图片? - 选项: - "1 张 (Recommended)" - "2 张" - "4 张" 6. **保存位置**:图片保存到哪里? - 建议默认:当前目录,文件名为 `generated_image_时间戳.png` - 让用户可以自定义路径 ### Step 4: 执行脚本 使用 skill 目录下的 `image-gen.js` 脚本: ```bash bun /path/to/skills/image-gen/image-gen.js "MODEL" "PROMPT" "ASPECT_RATIO" NUM_IMAGES "OUTPUT_DIR" "INPUT_IMAGE" ``` 参数说明: - MODEL: gemini-pro / seedream - PROMPT: 用户的图片描述 - ASPECT_RATIO: 图片比例(1:1, 4:3, 3:4, 16:9, 9:16) - NUM_IMAGES: 生成数量 - OUTPUT_DIR: 保存目录 - INPUT_IMAGE: (可选)输入图片路径,用于图片编辑模式 示例(纯文本生成): ```bash bun skills/image-gen/image-gen.js "gemini-pro" "一只在星空下的猫" "1:1" 1 "." ``` 示例(图片编辑): ```bash bun skills/image-gen/image-gen.js "gemini-pro" "把背景换成海边" "1:1" 1 "." "/path/to/input.jpg" ``` ### Step 5: 展示结果 生成完成后: 1. 告诉用户图片保存的完整路径 2. 显示生成的图片(如果系统支持): ```bash # macOS 上打开图片 open "OUTPUT_PATH" ``` 3. 报告使用的 tokens/credits(如果 API 返回) ### 常见问题处理 **API Key 无效**: - 请在 Max 设置中检查 Max API Key 是否正确配置 **生成失败**: - 检查 prompt 是否包含违规内容 - 尝试换一个模型 - 检查网络连接 **图片打不开**: - 确认文件完整下载 - 尝试使用其他图片查看器 ### 示例交互 用户:帮我生成一张图片,一只在星空下的猫 助手: 1. 检查环境变量和 Bun ✓ 2. 使用 AskUserQuestion 询问用户偏好 3. 根据选择执行脚本 4. 展示生成的图片 ### 交互风格 - 使用简单友好的语言 - 帮助用户优化 prompt(如果描述太简单,建议添加更多细节) - 如果遇到错误,提供清晰的解决方案 - 生成成功后给予积极反馈