--- name: video-analyzer description: 使用视觉/视频大模型分析视频内容。当用户说"分析视频"、"视频理解"、"看看这个视频"、"analyze video"时使用。 --- # Video Analyzer 通过视觉/视频大模型分析视频内容,支持本地视频文件和互联网视频。 ## 使用场景 - 用户要求分析、理解或描述一段视频 - 用户提供视频文件路径或 URL,希望了解视频内容 - 用户需要对视频进行问答 ## 配置 ### 环境变量 根据使用的模型设置对应的 API Key 环境变量: ```bash # 火山引擎(豆包) export ARK_API_KEY="your-api-key" # OpenAI export OPENAI_API_KEY="your-api-key" ``` ### 模型配置 编辑 `scripts/models.json` 添加或修改模型配置。每个模型需要: - `base_url` — API 地址 - `api_key_env` — 读取 API Key 的环境变量名 - `model` — 模型 ID - `api_type` — `responses` 或 `chat_completions` - `supports_video` — 是否支持原生视频输入 ## 工作流程 1. **确认视频来源**:获取用户提供的视频路径或 URL。 2. **确认分析需求**:明确用户想了解什么(如概括内容、回答问题、描述场景等)。如果 `$ARGUMENTS` 非空,将其作为分析提示词。 3. **选择模型**:默认使用 `models.json` 中的 `default_model`,用户也可指定。 4. **执行分析**:运行脚本(在 `scripts/` 目录下执行): ```bash uv run analyze.py --video <视频路径或URL> --prompt "<分析提示词>" ``` 可选参数: - `--model <名称>` — 指定模型(对应 models.json 中的 key) - `--frames <数量>` — 抽帧数量(默认 10) - `--max-size <像素>` — 帧最大边长(默认 720) 5. **展示结果**:将模型返回的分析结果展示给用户。 ## CLI 参考 ```bash # 本地视频 uv run analyze.py --video /path/to/video.mp4 --prompt "描述视频内容" # 互联网直接视频 URL uv run analyze.py --video https://example.com/video.mp4 --prompt "分析视频" # 视频站点 URL(YouTube、Bilibili 等) uv run analyze.py --video https://www.youtube.com/watch?v=xxxxx --prompt "总结视频" # 指定模型和抽帧数 uv run analyze.py --video video.mp4 --model doubao-vision --frames 20 --prompt "分析" ``` ## 注意事项 - 视频站点 URL 下载依赖 `yt-dlp`,已作为 Python 依赖自动安装 - 抽帧模式下,帧数越多分析越详细,但 API 调用成本也越高 - 大视频文件下载可能需要较长时间,请耐心等待