# Skill Seekers
[English](README.md) | [简体中文](README.zh-CN.md) | [日本語](README.ja.md) | [한국어](README.ko.md) | [Español](README.es.md) | [Français](README.fr.md) | [Deutsch](README.de.md) | [Português](README.pt-BR.md) | [Türkçe](README.tr.md) | [العربية](README.ar.md) | [हिन्दी](README.hi.md) | Русский
> ⚠️ **Уведомление о машинном переводе**
>
> Этот документ был автоматически переведён с помощью ИИ. Несмотря на наши усилия по обеспечению качества, возможны неточные выражения.
[](https://github.com/yusufkaraaslan/Skill_Seekers/releases)
[](https://opensource.org/licenses/MIT)
[](https://www.python.org/downloads/)
[](https://modelcontextprotocol.io)
[](tests/)
[](https://github.com/users/yusufkaraaslan/projects/2)
[](https://pypi.org/project/skill-seekers/)
[](https://pypi.org/project/skill-seekers/)
[](https://pypi.org/project/skill-seekers/)
[](https://pepy.tech/projects/skill-seekers)
[](https://skillseekersweb.com/)
[](https://x.com/_yUSyUS_)
[](https://github.com/yusufkaraaslan/Skill_Seekers)
**🧠 Слой данных для ИИ-систем.** Skill Seekers преобразует документацию сайтов, репозитории GitHub, PDF, видео, Jupyter-ноутбуки, вики и более 10 других типов источников в структурированные базы знаний — готовые к использованию в ИИ-навыках (Claude, Gemini, OpenAI), RAG-конвейерах (LangChain, LlamaIndex, Pinecone) и ИИ-помощниках для программирования (Cursor, Windsurf, Cline) за считанные минуты.
> 🌐 **[Посетите SkillSeekersWeb.com](https://skillseekersweb.com/)** — просматривайте 24+ готовых конфигураций, делитесь своими настройками и получайте доступ к полной документации!
> 📋 **[Смотрите дорожную карту разработки и задачи](https://github.com/users/yusufkaraaslan/projects/2)** — 134 задачи в 10 категориях, выберите любую для участия!
## 🌐 Экосистема
Skill Seekers — это мульти-репозиторный проект. Вот где находится каждая часть:
| Репозиторий | Описание | Ссылки |
|------------|----------|--------|
| **[Skill_Seekers](https://github.com/yusufkaraaslan/Skill_Seekers)** | Основной CLI и MCP сервер (этот репозиторий) | [PyPI](https://pypi.org/project/skill-seekers/) |
| **[skillseekersweb](https://github.com/yusufkaraaslan/skillseekersweb)** | Веб-сайт и документация | [Сайт](https://skillseekersweb.com/) |
| **[skill-seekers-configs](https://github.com/yusufkaraaslan/skill-seekers-configs)** | Репозиторий конфигураций сообщества | |
| **[skill-seekers-action](https://github.com/yusufkaraaslan/skill-seekers-action)** | GitHub Action для CI/CD | |
| **[skill-seekers-plugin](https://github.com/yusufkaraaslan/skill-seekers-plugin)** | Плагин Claude Code | |
| **[homebrew-skill-seekers](https://github.com/yusufkaraaslan/homebrew-skill-seekers)** | Homebrew tap для macOS | |
> **Хотите внести вклад?** Репозитории сайта и конфигураций — отличная отправная точка для новых участников!
## 🧠 Слой данных для ИИ-систем
**Skill Seekers — это универсальный слой предобработки**, расположенный между необработанной документацией и всеми ИИ-системами, которые её потребляют. Независимо от того, создаёте ли вы навыки для Claude, RAG-конвейер LangChain или файл `.cursorrules` для Cursor — подготовка данных одинакова. Выполните её один раз и экспортируйте во все целевые платформы.
```bash
# Одна команда → структурированная база знаний
skill-seekers create https://docs.react.dev/
# или: skill-seekers create facebook/react
# или: skill-seekers create ./my-project
# Экспорт в любую ИИ-систему
skill-seekers package output/react --target claude # → Claude AI навык (ZIP)
skill-seekers package output/react --target langchain # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor # → .cursorrules
skill-seekers package output/react --target ibm-bob # → Директория навыка IBM Bob
```
### Что создаётся
| Результат | Цель | Где используется |
|-----------|------|-----------------|
| **Claude навык** (ZIP + YAML) | `--target claude` | Claude Code, Claude API |
| **Gemini навык** (tar.gz) | `--target gemini` | Google Gemini |
| **OpenAI / Custom GPT** (ZIP) | `--target openai` | GPT-4o, пользовательские ассистенты |
| **LangChain Documents** | `--target langchain` | QA-цепочки, агенты, ретриверы |
| **LlamaIndex TextNodes** | `--target llama-index` | Движки запросов, движки диалогов |
| **Haystack Documents** | `--target haystack` | Корпоративные RAG-конвейеры |
| **Pinecone-ready** (Markdown) | `--target markdown` | Загрузка в векторное хранилище |
| **ChromaDB / FAISS / Qdrant** | `--target chroma/faiss/qdrant` | Локальные векторные базы данных |
| **IBM Bob навык** (директория) | `--target ibm-bob` | Проектные/глобальные навыки IBM Bob |
| **Cursor** `.cursorrules` | `--target markdown` → скопировать SKILL.md | Cursor IDE `.cursorrules` |
| **Windsurf / Cline / Continue** | `--target claude` → скопировать | VS Code, IntelliJ, Vim |
### Почему это важно
- ⚡ **На 99% быстрее** — дни ручной подготовки данных → 15–45 минут
- 🎯 **Качество ИИ-навыков** — файлы SKILL.md на 500+ строк с примерами, шаблонами и руководствами
- 📊 **Готовые к RAG блоки** — умная разбивка сохраняет блоки кода и контекст
- 🎬 **Видео** — извлечение кода, субтитров и структурированных знаний из YouTube и локальных видео
- 🔄 **Множество источников** — объединение 18 типов источников (документация, GitHub, PDF, видео, ноутбуки, вики и другие) в единую базу знаний
- 🌐 **Одна подготовка — все платформы** — экспорт одного актива на 21 платформу без повторного сканирования
- ✅ **Проверено в бою** — 3 700+ тестов, 24+ пресетов для фреймворков, готово к продакшену
## 🚀 Быстрый старт (3 команды)
```bash
# 1. Установка
pip install skill-seekers
# 2. Создание навыка из любого источника
skill-seekers create https://docs.django.com/
# 3. Упаковка для вашей ИИ-платформы
skill-seekers package output/django --target claude
```
**Вот и всё!** Теперь у вас есть готовый к использованию `output/django-claude.zip`.
```bash
# Использование другого ИИ-агента для улучшения (по умолчанию: claude)
skill-seekers create https://docs.django.com/ --agent kimi
skill-seekers create https://docs.django.com/ --agent codex
skill-seekers create https://docs.django.com/ --agent-cmd "my-custom-agent run"
```
### 🛰️ Сканирование проекта с помощью ИИ (новое)
Направьте `scan` на любой проект — ИИ-агент прочитает его манифесты, README,
Dockerfile/CI и выборку импортов исходного кода, а затем создаст по одной
конфигурации на каждый обнаруженный фреймворк плюс `-codebase.json`
для вашего собственного кода. Обнаруженная версия фиксируется, поэтому
повторные запуски сообщают об обновлениях:
```bash
skill-seekers scan ./my-react-app --out ./configs/scanned/
# → react.json, vite.json, tailwind.json, jest.json, my-react-app-codebase.json
# Затем соберите любую из них
skill-seekers create ./configs/scanned/react.json
```
Если для обнаружения нет готового пресета, ИИ генерирует новую конфигурацию;
при выходе её можно опционально опубликовать в [реестре сообщества](https://github.com/yusufkaraaslan/skill-seekers-configs).
### Другие источники (поддерживается 18)
```bash
# Репозиторий GitHub
skill-seekers create facebook/react
# Локальный проект
skill-seekers create ./my-project
# PDF-документ
skill-seekers create manual.pdf
# Документ Word
skill-seekers create report.docx
# Электронная книга EPUB
skill-seekers create book.epub
# Jupyter-ноутбук
skill-seekers create notebook.ipynb
# Спецификация OpenAPI
skill-seekers create openapi.yaml
# Презентация PowerPoint
skill-seekers create presentation.pptx
# Документ AsciiDoc
skill-seekers create guide.adoc
# Локальный HTML-файл (автоопределение по расширению)
skill-seekers create page.html
# Целая директория HTML-файлов (автоопределение для директорий с преобладанием HTML)
skill-seekers create ./mirror_output/site/
# Принудительный HTML-режим для смешанной директории с большим количеством кода
skill-seekers create ./repo/ --html-path ./repo/docs/build/html/
# RSS/Atom-лента
skill-seekers create feed.rss
# Man-страница
skill-seekers create curl.1
# Видео (YouTube, Vimeo или локальный файл — требуется skill-seekers[video])
skill-seekers create --video-url https://www.youtube.com/watch?v=... --name mytutorial
# Первый запуск? Автоматическая установка зависимостей с поддержкой GPU:
skill-seekers create --setup
# Вики Confluence
skill-seekers create --space-key TEAM --name wiki
# Страницы Notion
skill-seekers create --database-id ... --name docs
# Экспорт чатов Slack/Discord
skill-seekers create --chat-export-path ./slack-export --name team-chat
```
### Экспорт куда угодно
```bash
# Упаковка для нескольких платформ
for platform in claude gemini openai langchain; do
skill-seekers package output/django --target $platform
done
```
## Что такое Skill Seekers?
Skill Seekers — это **слой данных для ИИ-систем**, который преобразует 18 типов источников — документацию сайтов, репозитории GitHub, PDF, видео, Jupyter-ноутбуки, документы Word/EPUB/AsciiDoc, спецификации OpenAPI/Swagger, презентации PowerPoint, RSS/Atom-ленты, man-страницы, вики Confluence, страницы Notion, экспорты Slack/Discord и другое — в структурированные базы знаний для всех ИИ-целей:
| Сценарий использования | Что вы получаете | Примеры |
|----------------------|-----------------|---------|
| **ИИ-навыки** | Полный SKILL.md + справочные файлы | Claude Code, Gemini, GPT |
| **RAG-конвейеры** | Документы, разбитые на блоки с метаданными | LangChain, LlamaIndex, Haystack |
| **Векторные базы данных** | Предварительно отформатированные данные для загрузки | Pinecone, Chroma, Weaviate, FAISS |
| **ИИ-помощники для кода** | Файлы контекста, которые IDE-ИИ читает автоматически | Cursor, Windsurf, Cline, Continue.dev |
## 📚 Документация
| Я хочу... | Читайте это |
|-----------|-------------|
| **Быстро начать** | [Быстрый старт](docs/getting-started/02-quick-start.md) — 3 команды до первого навыка |
| **Понять концепции** | [Основные концепции](docs/user-guide/01-core-concepts.md) — как это работает |
| **Сканировать источники** | [Руководство по сканированию](docs/user-guide/02-scraping.md) — все типы источников |
| **Улучшать навыки** | [Руководство по улучшению](docs/user-guide/03-enhancement.md) — ИИ-улучшение |
| **Экспортировать навыки** | [Руководство по упаковке](docs/user-guide/04-packaging.md) — экспорт на платформы |
| **Найти команды** | [Справка по CLI](docs/reference/CLI_REFERENCE.md) — все 20 команд |
| **Настроить** | [Формат конфигурации](docs/reference/CONFIG_FORMAT.md) — спецификация JSON |
| **Решить проблемы** | [Устранение неполадок](docs/user-guide/06-troubleshooting.md) — типичные проблемы |
**Полная документация:** [docs/README.md](docs/README.md)
Skill Seekers заменяет дни ручной предобработки следующими шагами:
1. **Сбор** — документация, репозитории GitHub, локальные кодовые базы, PDF, видео, Jupyter-ноутбуки, вики и более 10 других типов источников
2. **Анализ** — глубокий AST-разбор, обнаружение паттернов, извлечение API
3. **Структурирование** — категоризированные справочные файлы с метаданными
4. **Улучшение** — генерация SKILL.md с помощью ИИ (Claude, Gemini или локально)
5. **Экспорт** — 16 платформоспецифичных форматов из одного актива
## Зачем использовать Skill Seekers?
### Для создателей ИИ-навыков (Claude, Gemini, OpenAI)
- 🎯 **Навыки продакшен-уровня** — файлы SKILL.md на 500+ строк с примерами кода, шаблонами и руководствами
- 🔄 **Рабочие процессы улучшения** — применяйте `security-focus`, `architecture-comprehensive` или пользовательские YAML-пресеты
- 🎮 **Любая предметная область** — игровые движки (Godot, Unity), фреймворки (React, Django), внутренние инструменты
- 🔧 **Командная работа** — объединяйте внутреннюю документацию + код в единый источник истины
- 📚 **Качество** — ИИ-улучшение с примерами, кратким справочником и навигацией
### Для RAG-разработчиков и ИИ-инженеров
- 🤖 **Данные, готовые к RAG** — предварительно разбитые LangChain `Documents`, LlamaIndex `TextNodes`, Haystack `Documents`
- 🚀 **На 99% быстрее** — дни предобработки → 15–45 минут
- 📊 **Умные метаданные** — категории, источники, типы → более точный поиск
- 🔄 **Множество источников** — объединяйте документацию + GitHub + PDF в одном конвейере
- 🌐 **Платформонезависимость** — экспорт в любую векторную базу данных или фреймворк без повторного сканирования
### Для пользователей ИИ-помощников для программирования
- 💻 **Cursor / Windsurf / Cline** — автоматическая генерация `.cursorrules` / `.windsurfrules` / `.clinerules`
- 🎯 **Постоянный контекст** — ИИ «знает» ваши фреймворки без повторных подсказок
- 📚 **Всегда актуально** — обновляйте контекст за минуты при изменении документации
## Ключевые возможности
### 🌐 Сканирование документации
- ✅ **Умное обнаружение SPA** — трёхуровневое обнаружение для JavaScript SPA-сайтов (sitemap.xml → llms.txt → рендеринг в безголовом браузере)
- ✅ **Поддержка llms.txt** — автоматическое обнаружение и использование LLM-ready файлов документации (в 10 раз быстрее)
- ✅ **Универсальный сканер** — работает с ЛЮБЫМ сайтом документации
- ✅ **Умная категоризация** — автоматическая организация контента по темам
- ✅ **Определение языка кода** — распознавание Python, JavaScript, C++, GDScript и других
- ✅ **24+ готовых пресетов** — Godot, React, Vue, Django, FastAPI и другие
### 📄 Поддержка PDF
- ✅ **Базовое извлечение PDF** — извлечение текста, кода и изображений из PDF-файлов
- ✅ **OCR для сканированных PDF** — извлечение текста из сканированных документов
- ✅ **PDF с паролем** — обработка зашифрованных PDF
- ✅ **Извлечение таблиц** — извлечение сложных таблиц из PDF
- ✅ **Параллельная обработка** — в 3 раза быстрее для больших PDF
- ✅ **Умное кэширование** — на 50% быстрее при повторных запусках
### 🎬 Извлечение из видео
- ✅ **YouTube и локальные видео** — извлечение субтитров, кода и структурированных знаний из видео
- ✅ **Анализ визуальных кадров** — OCR-извлечение из редакторов кода, терминалов, слайдов и диаграмм
- ✅ **Автоопределение GPU** — автоматическая установка правильной сборки PyTorch (CUDA/ROCm/MPS/CPU)
- ✅ **ИИ-улучшение** — двухэтапное: очистка артефактов OCR + генерация отполированного SKILL.md
- ✅ **Обрезка по времени** — извлечение определённых фрагментов с `--start-time` и `--end-time`
- ✅ **Поддержка плейлистов** — пакетная обработка всех видео в плейлисте YouTube
- ✅ **Резервный Vision API** — использование Claude Vision для OCR-кадров с низкой достоверностью
### 🐙 Анализ репозиториев GitHub
- ✅ **Глубокий анализ кода** — AST-разбор для Python, JavaScript, TypeScript, Java, C++, Go
- ✅ **Извлечение API** — функции, классы, методы с параметрами и типами
- ✅ **Метаданные репозитория** — README, дерево файлов, распределение языков, звёзды/форки
- ✅ **GitHub Issues и PR** — получение открытых/закрытых issues с метками и вехами
- ✅ **CHANGELOG и релизы** — автоматическое извлечение истории версий
- ✅ **Обнаружение конфликтов** — сравнение документированных API с фактической реализацией кода
- ✅ **MCP-интеграция** — на естественном языке: «Просканируй GitHub-репозиторий facebook/react»
### 🔄 Унифицированное мультиисточниковое сканирование
- ✅ **Объединение нескольких источников** — смешивайте документацию + GitHub + PDF в одном навыке
- ✅ **Обнаружение конфликтов** — автоматическое нахождение расхождений между документацией и кодом
- ✅ **Умное слияние** — на основе правил или с помощью ИИ
- ✅ **Прозрачная отчётность** — сравнение бок о бок с предупреждениями ⚠️
- ✅ **Анализ пробелов в документации** — выявление устаревшей документации и недокументированных функций
- ✅ **Единый источник истины** — один навык показывает и намерение (документация), и реальность (код)
- ✅ **Обратная совместимость** — устаревшие одноисточниковые конфигурации продолжают работать
### 🤖 Поддержка нескольких LLM-платформ
- ✅ **12 LLM-платформ** — Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, универсальный Markdown, OpenCode, Kimi (Moonshot AI), DeepSeek AI, Qwen (Alibaba), OpenRouter, Together AI, Fireworks AI
- ✅ **Универсальное сканирование** — одна и та же документация для всех платформ
- ✅ **Платформоспецифичная упаковка** — оптимизированные форматы для каждой LLM
- ✅ **Экспорт одной командой** — флаг `--target` для выбора платформы
- ✅ **Опциональные зависимости** — устанавливайте только то, что нужно
- ✅ **100% обратная совместимость** — существующие рабочие процессы Claude без изменений
| Платформа | Формат | Загрузка | Улучшение | API Key | Пользовательский эндпоинт |
|-----------|--------|----------|-----------|---------|--------------------------|
| **Claude AI** | ZIP + YAML | ✅ Авто | ✅ Да | ANTHROPIC_API_KEY | ANTHROPIC_BASE_URL |
| **Google Gemini** | tar.gz | ✅ Авто | ✅ Да | GOOGLE_API_KEY | - |
| **OpenAI ChatGPT** | ZIP + Vector Store | ✅ Авто | ✅ Да | OPENAI_API_KEY | - |
| **MiniMax AI** | ZIP + Knowledge Files | ✅ Авто | ✅ Да | MINIMAX_API_KEY | - |
| **Универсальный Markdown** | ZIP | ❌ Вручную | ❌ Нет | - | - |
```bash
# Claude (по умолчанию — без изменений!)
skill-seekers package output/react/
skill-seekers upload react.zip
# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini
# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai
# MiniMax AI
pip install skill-seekers[minimax]
skill-seekers package output/react/ --target minimax
skill-seekers upload react-minimax.zip --target minimax
# Универсальный Markdown (универсальный экспорт)
skill-seekers package output/react/ --target markdown
# Используйте markdown-файлы напрямую в любой LLM
```
🔧 Используйте собственного ИИ-провайдера (OpenAI-совместимые эндпоинты + подписки, кредиты Anthropic не нужны)
Опциональный этап ИИ-**улучшения** (используется командами `create`, `scan` и `enhance`) **не** требует ключа Anthropic. Есть три способа его запустить:
**1. Используйте подписку, за которую вы уже платите — вообще без API-кредитов (LOCAL-режим агента)**
Skill Seekers может вызывать CLI кодинг-агента, в который вы уже вошли, поэтому улучшение работает на вашем существующем тарифе вместо оплачиваемых API-токенов:
```bash
skill-seekers create --agent codex # OpenAI Codex CLI → ваш ChatGPT Plus
skill-seekers create --agent claude # Claude Code → ваш Claude Pro/Max
```
Поддерживаемые агенты: `claude`, `codex`, `copilot`, `opencode`, `kimi` и `custom`
(сочетайте `--agent custom` с `--agent-cmd " ..."`, чтобы использовать любой другой инструмент).
**2. Любой OpenAI-совместимый провайдер (OpenRouter, Groq, Cerebras, Mistral, NVIDIA NIM, …)**
Все они предоставляют OpenAI-совместимый эндпоинт `/v1`. Направьте Skill Seekers на один из них с помощью трёх переменных окружения — он обнаруживает `OPENAI_API_KEY`, а OpenAI SDK автоматически учитывает `OPENAI_BASE_URL`:
```bash
export OPENAI_API_KEY=""
export OPENAI_BASE_URL="https://openrouter.ai/api/v1" # эндпоинт провайдера (см. таблицу)
export OPENAI_MODEL="" # обязательно — модель по умолчанию gpt-4o в других местах не существует
skill-seekers create
```
| Провайдер | `OPENAI_BASE_URL` |
|--------------|--------------------------------------------|
| OpenRouter | `https://openrouter.ai/api/v1` |
| Groq | `https://api.groq.com/openai/v1` |
| Cerebras | `https://api.cerebras.ai/v1` |
| Mistral | `https://api.mistral.ai/v1` |
| NVIDIA NIM | `https://integrate.api.nvidia.com/v1` |
> Определение провайдера выбирает **первую** найденную переменную окружения с API-ключом (`ANTHROPIC_API_KEY` → `GOOGLE_API_KEY` → `OPENAI_API_KEY` → `MOONSHOT_API_KEY`). Установите `SKILL_SEEKER_PROVIDER`, чтобы принудительно выбрать конкретного провайдера, или убедитесь, что ключи с более высоким приоритетом не заданы.
**3. Claude-совместимые эндпоинты (например, GLM, прокси)**
```bash
export ANTHROPIC_API_KEY="your-key"
export ANTHROPIC_BASE_URL="https://your-claude-compatible-endpoint/v1"
```
Google Gemini (`GOOGLE_API_KEY`) и Kimi/Moonshot (`MOONSHOT_API_KEY`) также поддерживаются нативно. Полный список, включая переопределение моделей для каждого провайдера, см. в **[Справке по переменным окружения](docs/reference/ENVIRONMENT_VARIABLES.md#llm-provider-selection)**.
**Установка:**
```bash
# Установка с поддержкой Gemini
pip install skill-seekers[gemini]
# Установка с поддержкой OpenAI
pip install skill-seekers[openai]
# Установка с поддержкой MiniMax
pip install skill-seekers[minimax]
# Установка всех LLM-платформ
pip install skill-seekers[all-llms]
```
### 🔗 Интеграции с RAG-фреймворками
- ✅ **LangChain Documents** — прямой экспорт в формат `Document` с `page_content` + метаданными
- Подходит для: QA-цепочек, ретриверов, векторных хранилищ, агентов
- Пример: [LangChain RAG-конвейер](examples/langchain-rag-pipeline/)
- Руководство: [Интеграция с LangChain](docs/integrations/LANGCHAIN.md)
- ✅ **LlamaIndex TextNodes** — экспорт в формат `TextNode` с уникальными ID + эмбеддингами
- Подходит для: движков запросов, движков диалогов, контекста хранилища
- Пример: [LlamaIndex движок запросов](examples/llama-index-query-engine/)
- Руководство: [Интеграция с LlamaIndex](docs/integrations/LLAMA_INDEX.md)
- ✅ **Формат, готовый к Pinecone** — оптимизирован для загрузки в векторную базу данных
- Подходит для: продакшен-поиска по векторам, семантического и гибридного поиска
- Пример: [Загрузка в Pinecone](examples/pinecone-upsert/)
- Руководство: [Интеграция с Pinecone](docs/integrations/PINECONE.md)
**Быстрый экспорт:**
```bash
# LangChain Documents (JSON)
skill-seekers package output/django --target langchain
# → output/django-langchain.json
# LlamaIndex TextNodes (JSON)
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json
# Markdown (универсальный)
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/
```
**Полное руководство по RAG-конвейерам:** [Документация по RAG-конвейерам](docs/integrations/RAG_PIPELINES.md)
---
### 🧠 Интеграции с ИИ-помощниками для программирования
Преобразуйте документацию любого фреймворка в экспертный контекст для 4+ ИИ-помощников:
- ✅ **Cursor IDE** — генерация `.cursorrules` для ИИ-подсказок при написании кода
- Подходит для: генерации кода с учётом фреймворка, единообразных паттернов
- Руководство: [Интеграция с Cursor](docs/integrations/CURSOR.md)
- Пример: [Cursor React навык](examples/cursor-react-skill/)
- ✅ **Windsurf** — настройка контекста ИИ-помощника Windsurf через `.windsurfrules`
- Подходит для: встроенной ИИ-помощи в IDE, потоковое программирование
- Руководство: [Интеграция с Windsurf](docs/integrations/WINDSURF.md)
- Пример: [Windsurf FastAPI контекст](examples/windsurf-fastapi-context/)
- ✅ **Cline (VS Code)** — системные промпты + MCP для VS Code-агента
- Подходит для: автономной генерации кода в VS Code
- Руководство: [Интеграция с Cline](docs/integrations/CLINE.md)
- Пример: [Cline Django ассистент](examples/cline-django-assistant/)
- ✅ **Continue.dev** — контекстные серверы для IDE-независимого ИИ
- Подходит для: мультисредных окружений (VS Code, JetBrains, Vim), пользовательских LLM-провайдеров
- Руководство: [Интеграция с Continue](docs/integrations/CONTINUE_DEV.md)
- Пример: [Continue универсальный контекст](examples/continue-dev-universal/)
**Быстрый экспорт для ИИ-инструментов программирования:**
```bash
# Для любого ИИ-помощника (Cursor, Windsurf, Cline, Continue.dev)
skill-seekers create --config configs/django.json
skill-seekers package output/django --target claude # или --target markdown
# Скопируйте в свой проект (пример для Cursor)
cp output/django-claude/SKILL.md my-project/.cursorrules
# Или для Windsurf
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md
# Или для Cline
cp output/django-claude/SKILL.md my-project/.clinerules
# Или для Continue.dev (HTTP-сервер)
python examples/continue-dev-universal/context_server.py
# Настройте в ~/.continue/config.json
```
**Центр интеграций:** [Все интеграции с ИИ-системами](docs/integrations/INTEGRATIONS.md)
---
### 🌊 Трёхпоточная архитектура GitHub
- ✅ **Трёхпоточный анализ** — разделение GitHub-репозитория на потоки «Код», «Документация» и «Аналитика»
- ✅ **Унифицированный анализатор кодовой базы** — работает как с URL GitHub, так и с локальными путями
- ✅ **C3.x как глубина анализа** — выбор «basic» (1–2 мин) или «c3x» (20–60 мин)
- ✅ **Расширенная генерация маршрутизатора** — метаданные GitHub, быстрый старт из README, типичные проблемы
- ✅ **Интеграция Issues** — распространённые проблемы и решения из GitHub Issues
- ✅ **Умные ключевые слова маршрутизации** — метки GitHub с двойным весом для лучшего определения тем
**Описание трёх потоков:**
- **Поток 1: Код** — глубокий C3.x-анализ (паттерны, примеры, руководства, конфигурации, архитектура)
- **Поток 2: Документация** — документация репозитория (README, CONTRIBUTING, docs/*.md)
- **Поток 3: Аналитика** — знания сообщества (Issues, метки, звёзды, форки)
```python
from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer
# Анализ GitHub-репозитория со всеми тремя потоками
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
source="https://github.com/facebook/react",
depth="c3x", # или "basic" для быстрого анализа
fetch_github_metadata=True
)
# Доступ к потоку кода (C3.x-анализ)
print(f"Паттерны проектирования: {len(result.code_analysis['c3_1_patterns'])}")
print(f"Примеры из тестов: {result.code_analysis['c3_2_examples_count']}")
# Доступ к потоку документации (документация репозитория)
print(f"README: {result.github_docs['readme'][:100]}")
# Доступ к потоку аналитики (метаданные GitHub)
print(f"Звёзды: {result.github_insights['metadata']['stars']}")
print(f"Типичные проблемы: {len(result.github_insights['common_problems'])}")
```
**Полная документация**: [Сводка по реализации трёхпоточной архитектуры](docs/archive/historical/IMPLEMENTATION_SUMMARY_THREE_STREAM.md)
### 🔐 Умное управление лимитами запросов и конфигурация
- ✅ **Система конфигурации с несколькими токенами** — управление несколькими аккаунтами GitHub (личный, рабочий, open source)
- Безопасное хранение конфигурации в `~/.config/skill-seekers/config.json` (права 600)
- Стратегии лимита запросов для каждого профиля: `prompt`, `wait`, `switch`, `fail`
- Умная цепочка резервирования: аргумент CLI → переменная окружения → файл конфигурации → запрос
- ✅ **Интерактивный мастер настройки** — красивый терминальный интерфейс для простой настройки
- ✅ **Умный обработчик лимитов запросов** — больше никаких бесконечных ожиданий!
- Обратный отсчёт в реальном времени, автоматическое переключение профилей
- Четыре стратегии: prompt (спросить), wait (обратный отсчёт), switch (переключить), fail (прервать)
- ✅ **Возобновление** — продолжение прерванных задач
- ✅ **Поддержка CI/CD** — флаг `--non-interactive` для автоматизации
**Быстрая настройка:**
```bash
# Однократная настройка (5 минут)
skill-seekers config --github
# Использование определённого профиля для приватных репозиториев
skill-seekers create mycompany/private-repo --profile work
# Режим CI/CD (быстрый отказ, без запросов)
skill-seekers create owner/repo --non-interactive
# Возобновление прерванной задачи
skill-seekers resume --list
skill-seekers resume github_react_20260117_143022
```
**Описание стратегий лимита запросов:**
- **prompt** (по умолчанию) — спросить, что делать при достижении лимита (подождать, переключиться, настроить токен, отменить)
- **wait** — автоматически ждать с обратным отсчётом (учитывает тайм-аут)
- **switch** — автоматически пробовать следующий доступный профиль (для настроек с несколькими аккаунтами)
- **fail** — немедленно завершиться с понятной ошибкой (идеально для CI/CD)
### 🎯 Bootstrap-навык — самохостинг
Генерация skill-seekers как навыка для использования в вашем ИИ-агенте (Claude Code, Kimi, Codex и т. д.):
```bash
# Генерация навыка
./scripts/bootstrap_skill.sh
# Установка в Claude Code
cp -r output/skill-seekers ~/.claude/skills/
```
**Что вы получаете:**
- ✅ **Полная документация навыка** — все CLI-команды и шаблоны использования
- ✅ **Справка по CLI-командам** — каждый инструмент и его опции задокументированы
- ✅ **Примеры быстрого старта** — типичные рабочие процессы и лучшие практики
- ✅ **Автогенерируемая API-документация** — анализ кода, паттерны и примеры
### 🔐 Приватные репозитории конфигураций
- ✅ **Git-источники конфигураций** — получение конфигураций из приватных/командных Git-репозиториев
- ✅ **Управление несколькими источниками** — регистрация неограниченного количества репозиториев GitHub, GitLab, Bitbucket
- ✅ **Командная работа** — обмен пользовательскими конфигурациями в командах из 3–5 человек
- ✅ **Корпоративная поддержка** — масштабирование до 500+ разработчиков
- ✅ **Безопасная аутентификация** — токены через переменные окружения (GITHUB_TOKEN, GITLAB_TOKEN)
- ✅ **Умное кэширование** — клонируйте один раз, обновления подтягиваются автоматически
- ✅ **Офлайн-режим** — работа с кэшированными конфигурациями без подключения к сети
### 🤖 Анализ кодовой базы (C3.x)
**C3.4: Извлечение паттернов конфигурации с ИИ-улучшением**
- ✅ **9 форматов конфигурации** — JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
- ✅ **7 типов паттернов** — база данных, API, логирование, кэш, почта, аутентификация, сервер
- ✅ **ИИ-улучшение** — опциональный двухрежимный ИИ-анализ (API + LOCAL)
- ✅ **Анализ безопасности** — обнаружение жёстко закодированных секретов и открытых учётных данных
- ✅ **Автодокументирование** — генерация JSON + Markdown документации всех конфигураций
- ✅ **MCP-интеграция** — инструмент `extract_config_patterns` с поддержкой улучшения
**C3.3: ИИ-улучшенные пошаговые руководства**
- ✅ **Полное ИИ-улучшение** — преобразование базовых руководств в профессиональные учебники
- ✅ **5 автоматических улучшений** — описание шагов, устранение неполадок, предварительные требования, следующие шаги, сценарии использования
- ✅ **Двухрежимная поддержка** — API-режим (Claude API) или LOCAL-режим (Claude Code CLI)
- ✅ **Нулевые затраты в LOCAL-режиме** — БЕСПЛАТНОЕ улучшение с вашим планом Claude Code Max
- ✅ **Качественное преобразование** — шаблоны на 75 строк → подробные руководства на 500+ строк
**Использование:**
```bash
# Быстрый анализ (1–2 мин, только базовые функции)
skill-seekers scan tests/ --quick
# Комплексный анализ (с ИИ, 20–60 мин)
skill-seekers scan tests/ --comprehensive
# С ИИ-улучшением
skill-seekers scan tests/ --enhance
```
**Полная документация:** [docs/features/HOW_TO_GUIDES.md](docs/features/HOW_TO_GUIDES.md#ai-enhancement-new)
### 🔄 Пресеты рабочих процессов улучшения
Многоразовые YAML-определённые конвейеры улучшения, управляющие тем, как ИИ преобразует необработанную документацию в отшлифованный навык.
- ✅ **5 встроенных пресетов** — `default`, `minimal`, `security-focus`, `architecture-comprehensive`, `api-documentation`
- ✅ **Пользовательские пресеты** — добавляйте собственные рабочие процессы в `~/.config/skill-seekers/workflows/`
- ✅ **Цепочки рабочих процессов** — объединяйте два или более рабочих процесса в одной команде
- ✅ **Полное управление через CLI** — просмотр, копирование, добавление, удаление и валидация рабочих процессов
```bash
# Применение одного рабочего процесса
skill-seekers create ./my-project --enhance-workflow security-focus
# Цепочка нескольких рабочих процессов (применяются по порядку)
skill-seekers create ./my-project \
--enhance-workflow security-focus \
--enhance-workflow minimal
# Управление пресетами
skill-seekers workflows list # Список всех (встроенные + пользовательские)
skill-seekers workflows show security-focus # Показать содержимое YAML
skill-seekers workflows copy security-focus # Скопировать в пользовательскую директорию для редактирования
skill-seekers workflows add ./my-workflow.yaml # Установить пользовательский пресет
skill-seekers workflows remove my-workflow # Удалить пользовательский пресет
skill-seekers workflows validate security-focus # Проверить структуру пресета
# Копирование нескольких сразу
skill-seekers workflows copy security-focus minimal api-documentation
# Добавление нескольких файлов сразу
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml
# Удаление нескольких сразу
skill-seekers workflows remove my-wf-a my-wf-b
```
**Формат YAML-пресета:**
```yaml
name: security-focus
description: "Обзор безопасности: уязвимости, аутентификация, обработка данных"
version: "1.0"
stages:
- name: vulnerabilities
type: custom
prompt: "Проверить на OWASP Top 10 и распространённые уязвимости..."
- name: auth-review
type: custom
prompt: "Исследовать паттерны аутентификации и авторизации..."
uses_history: true
```
### ⚡ Производительность и масштаб
- ✅ **Асинхронный режим** — сканирование в 2–3 раза быстрее с async/await (флаг `--async`)
- ✅ **Поддержка большой документации** — обработка документов на 10K–40K+ страниц с умным разделением
- ✅ **Маршрутизатор/Hub-навыки** — интеллектуальная маршрутизация к специализированным поднавыкам
- ✅ **Параллельное сканирование** — одновременная обработка нескольких навыков
- ✅ **Контрольные точки/Возобновление** — прогресс никогда не теряется при длительном сканировании
- ✅ **Система кэширования** — сканируйте один раз, пересобирайте мгновенно
### 🤖 Генерация навыков, независимая от агента
- ✅ **Поддержка нескольких агентов** — генерация навыков для Claude, Kimi, Codex, Copilot, OpenCode или любого пользовательского агента через флаг `--agent`
- ✅ **Пользовательские команды агентов** — используйте `--agent-cmd`, чтобы задать собственную CLI-команду агента для улучшения
- ✅ **Универсальные флаги** — `--agent` и `--agent-cmd` доступны во всех командах (create, scrape, github, pdf и т. д.)
### 📦 Конвейер маркетплейса
- ✅ **Публикация в маркетплейсе** — публикация навыков в репозитории маркетплейса плагинов Claude Code
- ✅ **Сквозной конвейер** — от источника документации до опубликованной записи в маркетплейсе
### ✅ Контроль качества
- ✅ **Полное покрытие тестами** — 3 700+ тестов с обширным покрытием
---
## 📦 Установка
```bash
# Базовая установка (сканирование документации, анализ GitHub, PDF, упаковка)
pip install skill-seekers
# С поддержкой всех LLM-платформ
pip install skill-seekers[all-llms]
# С MCP-сервером
pip install skill-seekers[mcp]
# Всё включено
pip install skill-seekers[all]
```
**Нужна помощь с выбором?** Запустите мастер настройки:
```bash
skill-seekers-setup
```
### Варианты установки
| Команда установки | Функциональность |
|-------------------|-----------------|
| `pip install skill-seekers` | Сканирование, анализ GitHub, PDF, все платформы |
| `pip install skill-seekers[gemini]` | + Поддержка Google Gemini |
| `pip install skill-seekers[openai]` | + Поддержка OpenAI ChatGPT |
| `pip install skill-seekers[all-llms]` | + Все LLM-платформы |
| `pip install skill-seekers[mcp]` | + MCP-сервер |
| `pip install skill-seekers[video]` | + Извлечение субтитров и метаданных YouTube/Vimeo |
| `pip install skill-seekers[video-full]` | + Транскрипция Whisper и извлечение визуальных кадров |
| `pip install skill-seekers[jupyter]` | + Поддержка Jupyter-ноутбуков |
| `pip install skill-seekers[pptx]` | + Поддержка PowerPoint |
| `pip install skill-seekers[confluence]` | + Поддержка вики Confluence |
| `pip install skill-seekers[notion]` | + Поддержка страниц Notion |
| `pip install skill-seekers[rss]` | + Поддержка RSS/Atom-лент |
| `pip install skill-seekers[chat]` | + Поддержка экспорта чатов Slack/Discord |
| `pip install skill-seekers[asciidoc]` | + Поддержка документов AsciiDoc |
| `pip install skill-seekers[all]` | Всё включено |
> **Визуальные зависимости для видео (с поддержкой GPU):** После установки `skill-seekers[video-full]` запустите
> `skill-seekers create --setup` для автоопределения вашего GPU и установки правильной сборки PyTorch
> + easyocr. Это рекомендуемый способ установки зависимостей для визуального извлечения.
---
## 🚀 Рабочий процесс установки одной командой
**Самый быстрый способ от конфигурации до загруженного навыка — полная автоматизация:**
```bash
# Установка навыка React из официальных конфигураций (автозагрузка в Claude)
skill-seekers install --config react
# Установка из локального файла конфигурации
skill-seekers install --config configs/custom.json
# Установка без загрузки (только упаковка)
skill-seekers install --config django --no-upload
# Предпросмотр рабочего процесса без выполнения
skill-seekers install --config react --dry-run
```
**Время:** 20–45 минут всего | **Качество:** Готово к продакшену (9/10) | **Стоимость:** Бесплатно
**Выполняемые фазы:**
```
📥 ФАЗА 1: Получение конфигурации (если указано имя конфигурации)
📖 ФАЗА 2: Сканирование документации
✨ ФАЗА 3: ИИ-улучшение (ОБЯЗАТЕЛЬНО — без возможности пропуска)
📦 ФАЗА 4: Упаковка навыка
☁️ ФАЗА 5: Загрузка в Claude (опционально, требуется API Key)
```
**Требования:**
- Переменная окружения ANTHROPIC_API_KEY (для автозагрузки)
- План Claude Code Max (для локального ИИ-улучшения) или используйте `--agent` для выбора другого ИИ-агента
---
## 📊 Матрица функций
Skill Seekers поддерживает **12 LLM-платформ**, **8 RAG/векторных целей**, **18 типов источников** и полный паритет функций по всем целевым платформам.
**Платформы:** Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, универсальный Markdown, OpenCode, Kimi (Moonshot AI), DeepSeek AI, Qwen (Alibaba), OpenRouter, Together AI, Fireworks AI
**Типы источников:** Документация сайтов, репозитории GitHub, PDF, Word (.docx), EPUB, видео, локальные кодовые базы, Jupyter-ноутбуки, локальный HTML, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), RSS/Atom-ленты, man-страницы, вики Confluence, страницы Notion, экспорты чатов Slack/Discord
Подробности см. в [Полной матрице функций](docs/reference/FEATURE_MATRIX.md).
### Быстрое сравнение платформ
| Функция | Claude | Gemini | OpenAI | MiniMax | Markdown |
|---------|--------|--------|--------|---------|----------|
| Формат | ZIP + YAML | tar.gz | ZIP + Vector | ZIP + Knowledge | ZIP |
| Загрузка | ✅ API | ✅ API | ✅ API | ✅ API | ❌ Вручную |
| Улучшение | ✅ Sonnet 4 | ✅ 2.0 Flash | ✅ GPT-4o | ✅ M3 | ❌ Нет |
| Все режимы навыков | ✅ | ✅ | ✅ | ✅ | ✅ |
---
## Примеры использования
### Сканирование документации
```bash
# Сканирование документации сайта
skill-seekers create --config configs/react.json
# Быстрое сканирование без конфигурации
skill-seekers create https://react.dev --name react
# Асинхронный режим (в 3 раза быстрее)
skill-seekers create --config configs/godot.json --async --workers 8
# Использование конкретного ИИ-агента для улучшения
skill-seekers create --config configs/react.json --agent kimi
```
### Извлечение из PDF
```bash
# Базовое извлечение из PDF
skill-seekers create --pdf docs/manual.pdf --name myskill
# Расширенные функции
skill-seekers create --pdf docs/manual.pdf --name myskill \
--extract-tables \ # Извлечение таблиц
--parallel \ # Быстрая параллельная обработка
--workers 8 # Использование 8 ядер CPU
# Сканированные PDF (требуется: pip install pytesseract Pillow)
skill-seekers create --pdf docs/scanned.pdf --name myskill --ocr
```
### Извлечение из видео
```bash
# Установка поддержки видео
pip install skill-seekers[video] # Субтитры + метаданные
pip install skill-seekers[video-full] # + Whisper транскрипция + извлечение визуальных кадров
# Автоопределение GPU и установка визуальных зависимостей (PyTorch + easyocr)
skill-seekers create --setup
# Извлечение из видео YouTube
skill-seekers create --video-url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial
# Извлечение из плейлиста YouTube
skill-seekers create --video-playlist https://www.youtube.com/playlist?list=... --name myplaylist
# Извлечение из локального видеофайла
skill-seekers create --video-file recording.mp4 --name myrecording
# Извлечение с анализом визуальных кадров (требуются зависимости video-full)
skill-seekers create --video-url https://www.youtube.com/watch?v=... --name mytutorial --visual
# С ИИ-улучшением (очистка OCR + генерация отполированного SKILL.md)
skill-seekers create --video-url https://www.youtube.com/watch?v=... --visual --enhance-level 2
# Обрезка определённого фрагмента видео (поддерживаются секунды, MM:SS, HH:MM:SS)
skill-seekers create --video-url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00
# Использование Vision API для OCR-кадров с низкой достоверностью (требуется ANTHROPIC_API_KEY)
skill-seekers create --video-url https://www.youtube.com/watch?v=... --visual --vision-ocr
# Пересборка навыка из ранее извлечённых данных (пропуск загрузки)
skill-seekers create --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial
```
> **Полное руководство:** см. [docs/VIDEO_GUIDE.md](docs/VIDEO_GUIDE.md) для полной справки по CLI,
> деталей визуального конвейера, опций ИИ-улучшения и устранения неполадок.
### Анализ репозиториев GitHub
```bash
# Базовое сканирование репозитория
skill-seekers create facebook/react
# С аутентификацией (более высокие лимиты запросов)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers create facebook/react
# Настройка содержимого
skill-seekers create django/django \
--include-issues \ # Извлечение GitHub Issues
--max-issues 100 \ # Ограничение количества issues
--include-changelog # Извлечение CHANGELOG.md
```
### Унифицированное мультиисточниковое сканирование
**Объединение документации + GitHub + PDF в один навык с обнаружением конфликтов:**
```bash
# Использование готовых унифицированных конфигураций
skill-seekers create --config configs/react_unified.json
skill-seekers create --config configs/django_unified.json
# Или создание унифицированной конфигурации
cat > configs/myframework_unified.json << 'EOF'
{
"name": "myframework",
"merge_mode": "rule-based",
"sources": [
{
"type": "documentation",
"base_url": "https://docs.myframework.com/",
"max_pages": 200
},
{
"type": "github",
"repo": "owner/myframework",
"code_analysis_depth": "surface"
}
]
}
EOF
skill-seekers create --config configs/myframework_unified.json
```
**Обнаружение конфликтов автоматически находит:**
- 🔴 **Отсутствует в коде** (высокий приоритет): задокументировано, но не реализовано
- 🟡 **Отсутствует в документации** (средний приоритет): реализовано, но не задокументировано
- ⚠️ **Несовпадение сигнатур**: различные параметры/типы
- ℹ️ **Несовпадение описаний**: различные пояснения
**Полное руководство:** см. [docs/features/UNIFIED_SCRAPING.md](docs/features/UNIFIED_SCRAPING.md).
### Приватные репозитории конфигураций
**Обмен пользовательскими конфигурациями в команде через приватные Git-репозитории:**
```bash
# Использование MCP-инструментов для регистрации приватного командного репозитория
add_config_source(
name="team",
git_url="https://github.com/mycompany/skill-configs.git",
token_env="GITHUB_TOKEN"
)
# Получение конфигурации из командного репозитория
fetch_config(source="team", config_name="internal-api")
```
**Поддерживаемые платформы:**
- GitHub (`GITHUB_TOKEN`), GitLab (`GITLAB_TOKEN`), Gitea (`GITEA_TOKEN`), Bitbucket (`BITBUCKET_TOKEN`)
**Полное руководство:** см. [docs/reference/GIT_CONFIG_SOURCES.md](docs/reference/GIT_CONFIG_SOURCES.md).
## Как это работает
```mermaid
graph LR
A[Документация сайта] --> B[Skill Seekers]
B --> C[Сканер]
B --> D[ИИ-улучшение]
B --> E[Упаковщик]
C --> F[Организованные справочные файлы]
D --> F
F --> E
E --> G[ИИ-навык .zip]
G --> H[Загрузка на ИИ-платформу]
```
0. **Обнаружение llms.txt** — проверка наличия llms-full.txt, llms.txt, llms-small.txt (часть умного обнаружения SPA)
1. **Сканирование**: извлечение всех страниц из документации
2. **Категоризация**: организация контента по темам (API, руководства, учебники и т.д.)
3. **Улучшение**: ИИ анализирует документацию и создаёт всеобъемлющий SKILL.md с примерами (поддерживает несколько агентов через `--agent`)
4. **Упаковка**: объединение всего в готовый для платформы `.zip`-файл
## Архитектура
Система организована в **8 основных модулей** и **5 вспомогательных модулей** (всего ~200 классов):

| Модуль | Назначение | Ключевые классы |
|--------|------------|-----------------|
| **CLICore** | Диспетчер команд в стиле Git | `CLIDispatcher`, `SourceDetector`, `CreateCommand` |
| **Scrapers** | Извлечение из 18 типов источников | `DocToSkillConverter`, `DocumentSkillBuilder` (общий слой сборки), `UnifiedScraper` |
| **Adaptors** | 20+ форматов выходных платформ | `SkillAdaptor` (ABC), `ClaudeAdaptor`, `LangChainAdaptor` |
| **Analysis** | Конвейер анализа кодовой базы C3.x | `UnifiedCodebaseAnalyzer`, `PatternRecognizer`, 10 детекторов GoF |
| **Enhancement** | ИИ-улучшение навыков через `AgentClient` | `AgentClient`, `AIEnhancer`, `UnifiedEnhancer`, `WorkflowEngine` |
| **Packaging** | Упаковка, загрузка, установка навыков | `PackageSkill`, `InstallAgent` |
| **MCP** | FastMCP-сервер (40 инструментов) | `SkillSeekerMCPServer`, 10 модулей инструментов |
| **Sync** | Обнаружение изменений документации | `ChangeDetector`, `SyncMonitor`, `Notifier` |
Вспомогательные модули: **Parsers** (28 CLI-парсеров), **Storage** (S3/GCS/Azure), **Embedding** (векторы от нескольких провайдеров), **Benchmark** (производительность), **Utilities** (16 общих помощников).
Полные UML-диаграммы: **[docs/UML_ARCHITECTURE.md](docs/UML_ARCHITECTURE.md)** | Проект StarUML: `docs/UML/skill_seekers.mdj` | HTML-справка по API: `docs/UML/html/`
## 📋 Предварительные требования
**Перед началом убедитесь, что у вас есть:**
1. **Python 3.10 или выше** — [Скачать](https://www.python.org/downloads/) | Проверить: `python3 --version`
2. **Git** — [Скачать](https://git-scm.com/) | Проверить: `git --version`
3. **15–30 минут** для первоначальной настройки
**Впервые?** → **[Начните здесь: Безотказное руководство быстрого старта](BULLETPROOF_QUICKSTART.md)** 🎯
---
## 📤 Загрузка навыков в Claude
После упаковки навыка его необходимо загрузить в Claude:
### Вариант 1: Автоматическая загрузка (через API)
```bash
# Установка API Key (однократно)
export ANTHROPIC_API_KEY=sk-ant-...
# Упаковка и автоматическая загрузка
skill-seekers package output/react/ --upload
# ИЛИ загрузка существующего .zip
skill-seekers upload output/react.zip
```
### Вариант 2: Ручная загрузка (без API Key)
```bash
# Упаковка навыка
skill-seekers package output/react/
# → Создаёт output/react.zip
# Затем загрузите вручную:
# - Перейдите на https://claude.ai/skills
# - Нажмите «Upload Skill»
# - Выберите output/react.zip
```
### Вариант 3: MCP (Claude Code)
```
В Claude Code просто попросите:
"Упакуй и загрузи навык React"
```
---
## 🤖 Установка в ИИ-агенты
Skill Seekers может автоматически устанавливать навыки в 19 ИИ-агентов для программирования.
```bash
# Установка в конкретный агент
skill-seekers install-agent output/react/ --agent cursor
# Установка в IBM Bob (проектная директория .bob/skills/)
skill-seekers install-agent output/react/ --agent bob
# Установка во все агенты сразу
skill-seekers install-agent output/react/ --agent all
# Предпросмотр без установки
skill-seekers install-agent output/react/ --agent cursor --dry-run
```
### Поддерживаемые агенты
| Агент | Путь | Тип |
|-------|------|-----|
| **Claude Code** | `~/.claude/skills/` | Глобальный |
| **Cursor** | `.cursor/skills/` | Проектный |
| **VS Code / Copilot** | `.github/skills/` | Проектный |
| **Amp** | `~/.amp/skills/` | Глобальный |
| **Goose** | `~/.config/goose/skills/` | Глобальный |
| **OpenCode** | `~/.opencode/skills/` | Глобальный |
| **Windsurf** | `~/.windsurf/skills/` | Глобальный |
| **Roo Code** | `.roo/skills/` | Проектный |
| **Cline** | `.cline/skills/` | Проектный |
| **Aider** | `~/.aider/skills/` | Глобальный |
| **Bolt** | `.bolt/skills/` | Проектный |
| **Kilo Code** | `.kilo/skills/` | Проектный |
| **Continue** | `~/.continue/skills/` | Глобальный |
| **Kimi Code** | `~/.kimi/skills/` | Глобальный |
| **IBM Bob** | `.bob/skills/` | Проектный |
---
## 🔌 MCP-интеграция (40 инструментов)
Skill Seekers поставляется с MCP-сервером для использования из Claude Code, Cursor, Windsurf, VS Code + Cline или IntelliJ IDEA.
```bash
# Режим stdio (Claude Code, VS Code + Cline)
python -m skill_seekers.mcp.server_fastmcp
# Режим HTTP (Cursor, Windsurf, IntelliJ)
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765
# Автоматическая настройка всех агентов за раз
./setup_mcp.sh
```
**Все 40 инструментов:**
- **Основные (9):** `list_configs`, `generate_config`, `validate_config`, `estimate_pages`, `scrape_docs`, `package_skill`, `upload_skill`, `enhance_skill`, `install_skill`
- **Расширенные (10):** `scrape_github`, `scrape_pdf`, `unified_scrape`, `merge_sources`, `detect_conflicts`, `add_config_source`, `fetch_config`, `list_config_sources`, `remove_config_source`, `split_config`
- **Векторные БД (4):** `export_to_chroma`, `export_to_weaviate`, `export_to_faiss`, `export_to_qdrant`
- **Облачные (3):** `cloud_upload`, `cloud_download`, `cloud_list`
**Полное руководство:** [docs/guides/MCP_SETUP.md](docs/guides/MCP_SETUP.md)
---
## ⚙️ Конфигурация
### Доступные пресеты (24+)
```bash
# Список всех пресетов
# skill-seekers list-configs # Недоступно в v3.7.0
```
| Категория | Пресеты |
|-----------|---------|
| **Веб-фреймворки** | `react`, `vue`, `angular`, `svelte`, `nextjs` |
| **Python** | `django`, `flask`, `fastapi`, `sqlalchemy`, `pytest` |
| **Разработка игр** | `godot`, `pygame`, `unity` |
| **Инструменты и DevOps** | `docker`, `kubernetes`, `terraform`, `ansible` |
| **Унифицированные (документация + GitHub)** | `react-unified`, `vue-unified`, `nextjs-unified` и другие |
### Создание собственной конфигурации
```bash
# Вариант 1: Интерактивный
skill-seekers create --interactive
# Вариант 2: Копирование и редактирование пресета
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers create --config configs/myframework.json
```
### Структура файла конфигурации
```json
{
"name": "myframework",
"description": "Когда использовать этот навык",
"base_url": "https://docs.myframework.com/",
"selectors": {
"main_content": "article",
"title": "h1",
"code_blocks": "pre code"
},
"url_patterns": {
"include": ["/docs", "/guide"],
"exclude": ["/blog", "/about"]
},
"categories": {
"getting_started": ["intro", "quickstart"],
"api": ["api", "reference"]
},
"rate_limit": 0.5,
"max_pages": 500
}
```
### Где хранить конфигурации
Инструмент выполняет поиск в следующем порядке:
1. Точный путь, как указан
2. `./configs/` (текущая директория)
3. `~/.config/skill-seekers/configs/` (пользовательская директория конфигурации)
4. SkillSeekersWeb.com API (готовые конфигурации)
---
## 📊 Что создаётся
```
output/
├── godot_data/ # Полученные необработанные данные
│ ├── pages/ # JSON-файлы (по одному на страницу)
│ └── summary.json # Обзор
│
└── godot/ # Навык
├── SKILL.md # Улучшенный с реальными примерами
├── references/ # Категоризированная документация
│ ├── index.md
│ ├── getting_started.md
│ ├── scripting.md
│ └── ...
├── scripts/ # Пусто (добавьте свои скрипты)
└── assets/ # Пусто (добавьте свои ресурсы)
```
---
## 🐛 Устранение неполадок
### Контент не извлечён?
- Проверьте селектор `main_content`
- Попробуйте: `article`, `main`, `div[role="main"]`
### Данные есть, но не используются?
```bash
# Принудительное повторное сканирование
rm -rf output/myframework_data/
skill-seekers create --config configs/myframework.json
```
### Категоризация не устраивает?
Отредактируйте раздел `categories` в конфигурации, используя более подходящие ключевые слова.
### Хотите обновить документацию?
```bash
# Удалите старые данные и просканируйте заново
rm -rf output/godot_data/
skill-seekers create --config configs/godot.json
```
### Улучшение не работает?
```bash
# Проверьте, установлен ли API Key
echo $ANTHROPIC_API_KEY
# Попробуйте LOCAL-режим (использует Claude Code Max, API Key не нужен)
skill-seekers enhance output/react/ --mode LOCAL
# Мониторинг статуса фонового улучшения
skill-seekers enhance-status output/react/ --watch
```
### Проблемы с лимитами GitHub?
```bash
# Установите GitHub Token (5000 запросов/час вместо 60/час анонимно)
export GITHUB_TOKEN=ghp_your_token_here
# Или настройте несколько профилей
skill-seekers config --github
```
---
## 📈 Производительность
| Задача | Время | Примечания |
|--------|-------|-----------|
| Сканирование (синхр.) | 15–45 мин | Только первый раз, на основе потоков |
| Сканирование (асинхр.) | 5–15 мин | В 2–3 раза быстрее с флагом `--async` |
| Сборка | 1–3 мин | Быстрая пересборка из кэша |
| Пересборка | <1 мин | С `--skip-scrape` |
| Улучшение (LOCAL) | 30–60 сек | Использует Claude Code Max |
| Улучшение (API) | 20–40 сек | Требуется API Key |
| Видео (субтитры) | 1–3 мин | YouTube/локальное, только субтитры |
| Видео (визуальное) | 5–15 мин | + OCR-извлечение кадров |
| Упаковка | 5–10 сек | Создание итогового .zip |
---
## 🆕 Новое в v3.6.0
### Предустановки рабочих процессов
Управляйте глубиной анализа с помощью `--preset`:
```bash
skill-seekers create https://docs.react.dev/ --preset quick # Быстрый, поверхностный
skill-seekers create https://docs.react.dev/ --preset standard # Сбалансированный (по умолчанию)
skill-seekers create https://docs.react.dev/ --preset comprehensive # Глубокий, исчерпывающий
```
### Флаги жизненного цикла
```bash
skill-seekers create https://docs.react.dev/ --dry-run # Предпросмотр без сканирования
skill-seekers create https://docs.react.dev/ --fresh # Игнорировать кэш, полное пересканирование
skill-seekers create https://docs.react.dev/ --resume # Возобновить прерванную задачу
skill-seekers create https://docs.react.dev/ --skip-scrape # Переупаковать существующий результат
```
### Проверка здоровья и утилиты
```bash
skill-seekers doctor # Диагностика установки и окружения
skill-seekers sync-config # Обнаружение отклонений конфигурации
skill-seekers stream # Потоковое поглощение для больших документов
skill-seekers update output/react/ # Инкрементальное обновление
skill-seekers multilang # Генерация навыков на нескольких языках
skill-seekers quality output/react/ # Отчёт о качестве (добавьте --threshold 7 для контроля: ненулевой код выхода ниже 7/10)
```
### Опции RAG-фрагментации (упаковка)
```bash
skill-seekers package output/react/ --chunk-for-rag --chunk-tokens 512 --chunk-overlap-tokens 50
```
### Публикация в маркетплейсе
```bash
skill-seekers package output/react/ --marketplace --marketplace-category frontend
```
### Дополнительные опциональные зависимости
| Дополнение | Установка | Назначение |
|------------|-----------|------------|
| `browser` | `pip install "skill-seekers[browser]"` | Безголовый Playwright для SPA-сайтов |
| `embedding` | `pip install "skill-seekers[embedding]"` | Поддержка сервера эмбеддингов |
| `s3` / `gcs` / `azure` | `pip install "skill-seekers[s3]"` и т. д. | Загрузка в облачное хранилище |
| `rag-upload` | `pip install "skill-seekers[rag-upload]"` | Комбинированные зависимости загрузки в векторные БД |
---
## 📚 Документация
### Начало работы
- **[BULLETPROOF_QUICKSTART.md](BULLETPROOF_QUICKSTART.md)** — 🎯 **НАЧНИТЕ ЗДЕСЬ**, если вы новичок!
- **[QUICKSTART.md](docs/archive/legacy/QUICKSTART.md)** — Быстрый старт для опытных пользователей
- **[TROUBLESHOOTING.md](TROUBLESHOOTING.md)** — Распространённые проблемы и решения
- **[docs/archive/legacy/QUICK_REFERENCE.md](docs/archive/legacy/QUICK_REFERENCE.md)** — Краткая справка на одну страницу
### Архитектура
- **[docs/UML_ARCHITECTURE.md](docs/UML_ARCHITECTURE.md)** — Обзор UML-архитектуры с 14 диаграммами
- **[docs/UML/exports/](docs/UML/exports/)** — Экспорт диаграмм в PNG (обзор пакетов + 13 диаграмм классов)
- **[docs/UML/html/](docs/UML/html/index.html/index.html)** — Полная HTML-справка по API (все классы, операции, атрибуты)
- **[docs/UML/skill_seekers.mdj](docs/UML/skill_seekers.mdj)** — Файл проекта StarUML (откройте в [StarUML](https://staruml.io/))
### Руководства
- **[docs/reference/LARGE_DOCUMENTATION.md](docs/reference/LARGE_DOCUMENTATION.md)** — Работа с документами на 10K–40K+ страниц
- **[docs/features/ENHANCEMENT_MODES.md](docs/features/ENHANCEMENT_MODES.md)** — Руководство по режимам ИИ-улучшения
- **[docs/guides/MCP_SETUP.md](docs/guides/MCP_SETUP.md)** — Настройка MCP-интеграции
- **[docs/features/UNIFIED_SCRAPING.md](docs/features/UNIFIED_SCRAPING.md)** — Мультиисточниковое сканирование
- **[docs/VIDEO_GUIDE.md](docs/VIDEO_GUIDE.md)** — Полное руководство по извлечению из видео
### Руководства по интеграции
- **[docs/integrations/LANGCHAIN.md](docs/integrations/LANGCHAIN.md)** — LangChain RAG
- **[docs/integrations/CURSOR.md](docs/integrations/CURSOR.md)** — Cursor IDE
- **[docs/integrations/WINDSURF.md](docs/integrations/WINDSURF.md)** — Windsurf IDE
- **[docs/integrations/CLINE.md](docs/integrations/CLINE.md)** — Cline (VS Code)
- **[docs/integrations/RAG_PIPELINES.md](docs/integrations/RAG_PIPELINES.md)** — Все RAG-конвейеры
---
## 📝 Лицензия
Лицензия MIT — подробности в файле [LICENSE](LICENSE)
---
Удачного создания навыков! 🚀
---
## 🔒 Безопасность
[](https://mseep.ai/app/yusufkaraaslan-skill-seekers)
---
## 💛 Спонсоры
[Atlas Cloud](https://www.atlascloud.ai/?utm_source=github&utm_medium=link&utm_campaign=skill_seekers) — полномодальная, OpenAI-совместимая платформа ИИ-инференса. Skill Seekers поддерживает её как цель упаковки/улучшения через `--target atlas` с `ATLAS_API_KEY`.