--- name: ai-image-generator description: AI配图能力层 Skill。任何需要生成信息图的任务都调用此 Skill,而不是自行调用 API。包含:模型选择、API调用、多视角草图流程、风格库引用、配图索引联动。触发词:「需要绘图」「生成配图」「画一张图」「制作信息图」「根据这段文字画图」「图片提示词」。 --- # AI配图能力 Skill > 这是一个**能力层 Skill**,被其他 Skill 调用,不直接面向用户任务。 > 任何需要生成图片的 Skill 都应该引用本 Skill,而不是自行嵌入 API 细节。 --- ## 模型与 API | 优先级 | 模型 | 适用场景 | API Key | |---|---|---|---| | **首选** | `qwen-image-2.0-pro` | 含中文文字的信息图、结构图 | `sk-68b70d6863b94c299ecd27e9d49b41ba` | | **次选** | `wan2.6-t2i` | 纯视觉风格图(无需复杂中文文字排版)| 同上(dashscope)| | 备用 | `gpt-image-1`(DMXAPI)| 英文为主的极简图 | `sk-wzI4JscScaJ1pxVKRQ4qxmJcpH1OIgsqshlP55Tq6NtZ3H5p` | **选择原则**:信息图/结构图/有中文标注 → 用 `qwen-image-2.0-pro`;纯视觉风格图 → 用 `wan2.6-t2i`。 **`wan2.6-t2i` API 调用**(endpoint 不同): ```python url = 'https://dashscope.aliyuncs.com/api/v1/services/aigc/text2image/image-synthesis' body = {'model': 'wan2.6-t2i', 'input': {'prompt': 'PROMPT'}, 'parameters': {'size': '1024*1024', 'n': 1}} ``` ⚠️ **已知问题**:DMXAPI 上的 DALL-E 3 有较高概率网络超时(实测超时案例:2026-03-20 向日葵调研任务)。遇到超时时直接切换 qwen-image-2.0-pro,不要反复重试 DALL-E 3。 ### qwen-image-2.0-pro API 调用 ```python import requests, base64 API_KEY = 'sk-68b70d6863b94c299ecd27e9d49b41ba' ENDPOINT = 'https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation' headers = {'Content-Type': 'application/json', 'Authorization': f'Bearer {API_KEY}'} payload = { "model": "qwen-image-2.0-pro", "input": {"messages": [{"role": "user", "content": [{"text": "你的提示词"}]}]}, "parameters": { "n": 1, "watermark": False, "prompt_extend": True, "size": "1024*1024" # 标准图;小图同尺寸,HTML 中用 max-width: 65% 控制 } } resp = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120) img_url = resp.json()['output']['choices'][0]['message']['content'][0]['image'] # 下载并保存(URL 24 小时有效,立即保存) ir = requests.get(img_url, timeout=60) with open('output.png', 'wb') as f: f.write(ir.content) ``` ⚠️ **限速处理**:遇到 429 时等待 30 秒后重试,最多重试 3 次。 --- ## 风格库 风格库文件:`_内部总控/产品定义/图片风格库.md`(10种风格,当前文章使用 **S03**) **S03 标准提示词前缀**(适合大多数中文信息图): ``` 简洁专业的信息图,适合微信文章,白色背景。[内容描述] 深蓝色#1a2f5e和橙色#e8622c为主色,圆角矩形,清晰中文标注,整体简洁商务风格。 ``` --- ## 全景图优先原则(先于绘图流程执行) > 核心规则:**先建立完整的对象-关系模型,再决定画什么图** ### 对象-关系分析(Step 0,必须在 Step 1 之前完成) 在分析段落逻辑之前,先问自己: ``` 1. 这段内容描述的「系统」里有哪些对象? (人 / 设备 / 服务 / 组织 / 数据 / 概念阶段...) 2. 这些对象之间有哪些关系? (数据流 / 指令控制 / 包含/被包含 / 演化前后 / 并列对比...) 3. 我现在要画的是「全景图」还是「局部图」? 全景图:展示系统所有对象及一级关系 → 优先画 局部图:聚焦某对对象的交互细节 → 作为补充 4. 如果是局部图,前面是否已经有对应的全景图? 没有 → 先画全景图,再画局部图 有 → 可以直接画局部图,但在提示词里说明「这是XX全景图的局部放大」 ``` ### 五种全景图类型(优先选用) | 类型 | 使用时机 | 结构 | |---|---|---| | **系统全景图** | 展示所有组成部分及关系 | 对象节点 + 层次边框 + 关系箭头 | | **演化状态图** | 系统随时间的状态变化 | 横向时间轴 + N个状态并列 | | **并列对比图** | 多种方案/模式的异同 | N列相同结构 + 内容不同 | | **层次依赖图** | 技术栈或组织的依赖关系 | 垂直叠加 + 依赖箭头 | | **双列映射图** | 理论框架 vs 实际形态 | 左右两列 + 对应连线 | **参考图库**:`_内部总控/产品定义/图片参考库/架构图-全景对象关系型/` ### 人-设备-服务器-云端 场景的标准全景图要素 当内容涉及「人-AI协作」「多设备」「分布式」等场景时,全景图必须包含: ``` 对象层(从下到上,或从内到外): ① 个人设备层:用户 + 本地PC + 手机 ② 组织局域层:组织服务器 + 组织内成员 ③ 云端层:云服务/API/OpenBrain ④ 社会层:跨组织交互/世界 关系标注: 局域网连线(实线/虚线区分) 云端上传(带方向箭头) 数据流动(带标注:数据类型/权限级别) 包含关系(用大矩形框圈定边界) ``` --- ## 绘图流程(每张图必须走完) ### Step 1:分析段落逻辑(含对象-关系检查) 在开始绘图之前,必须先回答: 1. 这张图对应手稿哪个段落?(定位行号/小节) 2. 这段文字涉及哪些「对象」?(穷举:人/设备/服务/组织/数据/概念...) 3. 这些对象之间有哪些「关系」?(列出所有连接和方向) 4. 这是「全景图」还是「局部图」?(参见全景图优先原则) 5. 这张图如果画成功,读者读完会在脑子里形成什么**完整的系统印象**? 6. 图不只是文字映射——它应该让读者建立「这个系统里有什么、它们怎么连」的完整心智模型 ### Step 2:从多个视角设计草图 对每张图,至少从 **2 个独立逻辑视角**各写一条提示词: - 视角A:[逻辑A],提示词:`...` - 视角B:[逻辑B],提示词:`...` ⛔ **禁止**:只写一条提示词直接生成,跳过视角分析 ### Step 3:调用 API 生成 按上方 API 调用格式,对每个视角各生成一张图。 ### Step 4:更新配图索引 生成完毕后,必须在对应文章的 `配图索引_[文章名].md` 中追加/更新条目: ``` | 图片文件名 | 对应段落 | 段落核心主旨 | 提示词摘要 | 状态 | ``` 如果文章还没有配图索引,立即创建(模板:`.cursor/skills/wechat-article-writer/templates/配图索引模板.md`)。 ### Step 5:嵌入到 HTML - **大图**(核心结构图):`max-width: 100%` - **小图**(辅助说明图、循环图、对比图):`max-width: 65%` ```html