# Skill Seekers [English](README.md) | [简体中文](README.zh-CN.md) | [日本語](README.ja.md) | [한국어](README.ko.md) | [Español](README.es.md) | [Français](README.fr.md) | [Deutsch](README.de.md) | [Português](README.pt-BR.md) | [Türkçe](README.tr.md) | [العربية](README.ar.md) | [हिन्दी](README.hi.md) | Русский > ⚠️ **Уведомление о машинном переводе** > > Этот документ был автоматически переведён с помощью ИИ. Несмотря на наши усилия по обеспечению качества, возможны неточные выражения. [![Версия](https://img.shields.io/badge/version-3.7.0-blue.svg)](https://github.com/yusufkaraaslan/Skill_Seekers/releases) [![Лицензия: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT) [![Python 3.10+](https://img.shields.io/badge/python-3.10+-blue.svg)](https://www.python.org/downloads/) [![MCP-интеграция](https://img.shields.io/badge/MCP-40-Tools-blue.svg)](https://modelcontextprotocol.io) [![Тесты пройдены](https://img.shields.io/badge/Tests-3700%2B%20Passing-brightgreen.svg)](tests/) [![Доска проекта](https://img.shields.io/badge/Project-Board-purple.svg)](https://github.com/users/yusufkaraaslan/projects/2) [![PyPI версия](https://badge.fury.io/py/skill-seekers.svg)](https://pypi.org/project/skill-seekers/) [![PyPI - Загрузки](https://img.shields.io/pypi/dm/skill-seekers.svg)](https://pypi.org/project/skill-seekers/) [![PyPI - Версия Python](https://img.shields.io/pypi/pyversions/skill-seekers.svg)](https://pypi.org/project/skill-seekers/) [![PyPI Downloads](https://static.pepy.tech/personalized-badge/skill-seekers?period=total&units=INTERNATIONAL_SYSTEM&left_color=BLACK&right_color=GREEN&left_text=downloads)](https://pepy.tech/projects/skill-seekers)

[![Веб-сайт](https://img.shields.io/badge/Website-skillseekersweb.com-blue.svg)](https://skillseekersweb.com/) [![Twitter](https://img.shields.io/twitter/follow/_yUSyUS_?style=social)](https://x.com/_yUSyUS_) [![GitHub Stars](https://img.shields.io/github/stars/yusufkaraaslan/Skill_Seekers?style=social)](https://github.com/yusufkaraaslan/Skill_Seekers) **🧠 Слой данных для ИИ-систем.** Skill Seekers преобразует документацию сайтов, репозитории GitHub, PDF, видео, Jupyter-ноутбуки, вики и более 10 других типов источников в структурированные базы знаний — готовые к использованию в ИИ-навыках (Claude, Gemini, OpenAI), RAG-конвейерах (LangChain, LlamaIndex, Pinecone) и ИИ-помощниках для программирования (Cursor, Windsurf, Cline) за считанные минуты. > 🌐 **[Посетите SkillSeekersWeb.com](https://skillseekersweb.com/)** — просматривайте 24+ готовых конфигураций, делитесь своими настройками и получайте доступ к полной документации! > 📋 **[Смотрите дорожную карту разработки и задачи](https://github.com/users/yusufkaraaslan/projects/2)** — 134 задачи в 10 категориях, выберите любую для участия! ## 🌐 Экосистема Skill Seekers — это мульти-репозиторный проект. Вот где находится каждая часть: | Репозиторий | Описание | Ссылки | |------------|----------|--------| | **[Skill_Seekers](https://github.com/yusufkaraaslan/Skill_Seekers)** | Основной CLI и MCP сервер (этот репозиторий) | [PyPI](https://pypi.org/project/skill-seekers/) | | **[skillseekersweb](https://github.com/yusufkaraaslan/skillseekersweb)** | Веб-сайт и документация | [Сайт](https://skillseekersweb.com/) | | **[skill-seekers-configs](https://github.com/yusufkaraaslan/skill-seekers-configs)** | Репозиторий конфигураций сообщества | | | **[skill-seekers-action](https://github.com/yusufkaraaslan/skill-seekers-action)** | GitHub Action для CI/CD | | | **[skill-seekers-plugin](https://github.com/yusufkaraaslan/skill-seekers-plugin)** | Плагин Claude Code | | | **[homebrew-skill-seekers](https://github.com/yusufkaraaslan/homebrew-skill-seekers)** | Homebrew tap для macOS | | > **Хотите внести вклад?** Репозитории сайта и конфигураций — отличная отправная точка для новых участников! ## 🧠 Слой данных для ИИ-систем **Skill Seekers — это универсальный слой предобработки**, расположенный между необработанной документацией и всеми ИИ-системами, которые её потребляют. Независимо от того, создаёте ли вы навыки для Claude, RAG-конвейер LangChain или файл `.cursorrules` для Cursor — подготовка данных одинакова. Выполните её один раз и экспортируйте во все целевые платформы. ```bash # Одна команда → структурированная база знаний skill-seekers create https://docs.react.dev/ # или: skill-seekers create facebook/react # или: skill-seekers create ./my-project # Экспорт в любую ИИ-систему skill-seekers package output/react --target claude # → Claude AI навык (ZIP) skill-seekers package output/react --target langchain # → LangChain Documents skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes skill-seekers package output/react --target cursor # → .cursorrules skill-seekers package output/react --target ibm-bob # → Директория навыка IBM Bob ``` ### Что создаётся | Результат | Цель | Где используется | |-----------|------|-----------------| | **Claude навык** (ZIP + YAML) | `--target claude` | Claude Code, Claude API | | **Gemini навык** (tar.gz) | `--target gemini` | Google Gemini | | **OpenAI / Custom GPT** (ZIP) | `--target openai` | GPT-4o, пользовательские ассистенты | | **LangChain Documents** | `--target langchain` | QA-цепочки, агенты, ретриверы | | **LlamaIndex TextNodes** | `--target llama-index` | Движки запросов, движки диалогов | | **Haystack Documents** | `--target haystack` | Корпоративные RAG-конвейеры | | **Pinecone-ready** (Markdown) | `--target markdown` | Загрузка в векторное хранилище | | **ChromaDB / FAISS / Qdrant** | `--target chroma/faiss/qdrant` | Локальные векторные базы данных | | **IBM Bob навык** (директория) | `--target ibm-bob` | Проектные/глобальные навыки IBM Bob | | **Cursor** `.cursorrules` | `--target markdown` → скопировать SKILL.md | Cursor IDE `.cursorrules` | | **Windsurf / Cline / Continue** | `--target claude` → скопировать | VS Code, IntelliJ, Vim | ### Почему это важно - ⚡ **На 99% быстрее** — дни ручной подготовки данных → 15–45 минут - 🎯 **Качество ИИ-навыков** — файлы SKILL.md на 500+ строк с примерами, шаблонами и руководствами - 📊 **Готовые к RAG блоки** — умная разбивка сохраняет блоки кода и контекст - 🎬 **Видео** — извлечение кода, субтитров и структурированных знаний из YouTube и локальных видео - 🔄 **Множество источников** — объединение 18 типов источников (документация, GitHub, PDF, видео, ноутбуки, вики и другие) в единую базу знаний - 🌐 **Одна подготовка — все платформы** — экспорт одного актива на 21 платформу без повторного сканирования - ✅ **Проверено в бою** — 3 700+ тестов, 24+ пресетов для фреймворков, готово к продакшену ## 🚀 Быстрый старт (3 команды) ```bash # 1. Установка pip install skill-seekers # 2. Создание навыка из любого источника skill-seekers create https://docs.django.com/ # 3. Упаковка для вашей ИИ-платформы skill-seekers package output/django --target claude ``` **Вот и всё!** Теперь у вас есть готовый к использованию `output/django-claude.zip`. ```bash # Использование другого ИИ-агента для улучшения (по умолчанию: claude) skill-seekers create https://docs.django.com/ --agent kimi skill-seekers create https://docs.django.com/ --agent codex skill-seekers create https://docs.django.com/ --agent-cmd "my-custom-agent run" ``` ### 🛰️ Сканирование проекта с помощью ИИ (новое) Направьте `scan` на любой проект — ИИ-агент прочитает его манифесты, README, Dockerfile/CI и выборку импортов исходного кода, а затем создаст по одной конфигурации на каждый обнаруженный фреймворк плюс `-codebase.json` для вашего собственного кода. Обнаруженная версия фиксируется, поэтому повторные запуски сообщают об обновлениях: ```bash skill-seekers scan ./my-react-app --out ./configs/scanned/ # → react.json, vite.json, tailwind.json, jest.json, my-react-app-codebase.json # Затем соберите любую из них skill-seekers create ./configs/scanned/react.json ``` Если для обнаружения нет готового пресета, ИИ генерирует новую конфигурацию; при выходе её можно опционально опубликовать в [реестре сообщества](https://github.com/yusufkaraaslan/skill-seekers-configs). ### Другие источники (поддерживается 18) ```bash # Репозиторий GitHub skill-seekers create facebook/react # Локальный проект skill-seekers create ./my-project # PDF-документ skill-seekers create manual.pdf # Документ Word skill-seekers create report.docx # Электронная книга EPUB skill-seekers create book.epub # Jupyter-ноутбук skill-seekers create notebook.ipynb # Спецификация OpenAPI skill-seekers create openapi.yaml # Презентация PowerPoint skill-seekers create presentation.pptx # Документ AsciiDoc skill-seekers create guide.adoc # Локальный HTML-файл (автоопределение по расширению) skill-seekers create page.html # Целая директория HTML-файлов (автоопределение для директорий с преобладанием HTML) skill-seekers create ./mirror_output/site/ # Принудительный HTML-режим для смешанной директории с большим количеством кода skill-seekers create ./repo/ --html-path ./repo/docs/build/html/ # RSS/Atom-лента skill-seekers create feed.rss # Man-страница skill-seekers create curl.1 # Видео (YouTube, Vimeo или локальный файл — требуется skill-seekers[video]) skill-seekers create --video-url https://www.youtube.com/watch?v=... --name mytutorial # Первый запуск? Автоматическая установка зависимостей с поддержкой GPU: skill-seekers create --setup # Вики Confluence skill-seekers create --space-key TEAM --name wiki # Страницы Notion skill-seekers create --database-id ... --name docs # Экспорт чатов Slack/Discord skill-seekers create --chat-export-path ./slack-export --name team-chat ``` ### Экспорт куда угодно ```bash # Упаковка для нескольких платформ for platform in claude gemini openai langchain; do skill-seekers package output/django --target $platform done ``` ## Что такое Skill Seekers? Skill Seekers — это **слой данных для ИИ-систем**, который преобразует 18 типов источников — документацию сайтов, репозитории GitHub, PDF, видео, Jupyter-ноутбуки, документы Word/EPUB/AsciiDoc, спецификации OpenAPI/Swagger, презентации PowerPoint, RSS/Atom-ленты, man-страницы, вики Confluence, страницы Notion, экспорты Slack/Discord и другое — в структурированные базы знаний для всех ИИ-целей: | Сценарий использования | Что вы получаете | Примеры | |----------------------|-----------------|---------| | **ИИ-навыки** | Полный SKILL.md + справочные файлы | Claude Code, Gemini, GPT | | **RAG-конвейеры** | Документы, разбитые на блоки с метаданными | LangChain, LlamaIndex, Haystack | | **Векторные базы данных** | Предварительно отформатированные данные для загрузки | Pinecone, Chroma, Weaviate, FAISS | | **ИИ-помощники для кода** | Файлы контекста, которые IDE-ИИ читает автоматически | Cursor, Windsurf, Cline, Continue.dev | ## 📚 Документация | Я хочу... | Читайте это | |-----------|-------------| | **Быстро начать** | [Быстрый старт](docs/getting-started/02-quick-start.md) — 3 команды до первого навыка | | **Понять концепции** | [Основные концепции](docs/user-guide/01-core-concepts.md) — как это работает | | **Сканировать источники** | [Руководство по сканированию](docs/user-guide/02-scraping.md) — все типы источников | | **Улучшать навыки** | [Руководство по улучшению](docs/user-guide/03-enhancement.md) — ИИ-улучшение | | **Экспортировать навыки** | [Руководство по упаковке](docs/user-guide/04-packaging.md) — экспорт на платформы | | **Найти команды** | [Справка по CLI](docs/reference/CLI_REFERENCE.md) — все 20 команд | | **Настроить** | [Формат конфигурации](docs/reference/CONFIG_FORMAT.md) — спецификация JSON | | **Решить проблемы** | [Устранение неполадок](docs/user-guide/06-troubleshooting.md) — типичные проблемы | **Полная документация:** [docs/README.md](docs/README.md) Skill Seekers заменяет дни ручной предобработки следующими шагами: 1. **Сбор** — документация, репозитории GitHub, локальные кодовые базы, PDF, видео, Jupyter-ноутбуки, вики и более 10 других типов источников 2. **Анализ** — глубокий AST-разбор, обнаружение паттернов, извлечение API 3. **Структурирование** — категоризированные справочные файлы с метаданными 4. **Улучшение** — генерация SKILL.md с помощью ИИ (Claude, Gemini или локально) 5. **Экспорт** — 16 платформоспецифичных форматов из одного актива ## Зачем использовать Skill Seekers? ### Для создателей ИИ-навыков (Claude, Gemini, OpenAI) - 🎯 **Навыки продакшен-уровня** — файлы SKILL.md на 500+ строк с примерами кода, шаблонами и руководствами - 🔄 **Рабочие процессы улучшения** — применяйте `security-focus`, `architecture-comprehensive` или пользовательские YAML-пресеты - 🎮 **Любая предметная область** — игровые движки (Godot, Unity), фреймворки (React, Django), внутренние инструменты - 🔧 **Командная работа** — объединяйте внутреннюю документацию + код в единый источник истины - 📚 **Качество** — ИИ-улучшение с примерами, кратким справочником и навигацией ### Для RAG-разработчиков и ИИ-инженеров - 🤖 **Данные, готовые к RAG** — предварительно разбитые LangChain `Documents`, LlamaIndex `TextNodes`, Haystack `Documents` - 🚀 **На 99% быстрее** — дни предобработки → 15–45 минут - 📊 **Умные метаданные** — категории, источники, типы → более точный поиск - 🔄 **Множество источников** — объединяйте документацию + GitHub + PDF в одном конвейере - 🌐 **Платформонезависимость** — экспорт в любую векторную базу данных или фреймворк без повторного сканирования ### Для пользователей ИИ-помощников для программирования - 💻 **Cursor / Windsurf / Cline** — автоматическая генерация `.cursorrules` / `.windsurfrules` / `.clinerules` - 🎯 **Постоянный контекст** — ИИ «знает» ваши фреймворки без повторных подсказок - 📚 **Всегда актуально** — обновляйте контекст за минуты при изменении документации ## Ключевые возможности ### 🌐 Сканирование документации - ✅ **Умное обнаружение SPA** — трёхуровневое обнаружение для JavaScript SPA-сайтов (sitemap.xml → llms.txt → рендеринг в безголовом браузере) - ✅ **Поддержка llms.txt** — автоматическое обнаружение и использование LLM-ready файлов документации (в 10 раз быстрее) - ✅ **Универсальный сканер** — работает с ЛЮБЫМ сайтом документации - ✅ **Умная категоризация** — автоматическая организация контента по темам - ✅ **Определение языка кода** — распознавание Python, JavaScript, C++, GDScript и других - ✅ **24+ готовых пресетов** — Godot, React, Vue, Django, FastAPI и другие ### 📄 Поддержка PDF - ✅ **Базовое извлечение PDF** — извлечение текста, кода и изображений из PDF-файлов - ✅ **OCR для сканированных PDF** — извлечение текста из сканированных документов - ✅ **PDF с паролем** — обработка зашифрованных PDF - ✅ **Извлечение таблиц** — извлечение сложных таблиц из PDF - ✅ **Параллельная обработка** — в 3 раза быстрее для больших PDF - ✅ **Умное кэширование** — на 50% быстрее при повторных запусках ### 🎬 Извлечение из видео - ✅ **YouTube и локальные видео** — извлечение субтитров, кода и структурированных знаний из видео - ✅ **Анализ визуальных кадров** — OCR-извлечение из редакторов кода, терминалов, слайдов и диаграмм - ✅ **Автоопределение GPU** — автоматическая установка правильной сборки PyTorch (CUDA/ROCm/MPS/CPU) - ✅ **ИИ-улучшение** — двухэтапное: очистка артефактов OCR + генерация отполированного SKILL.md - ✅ **Обрезка по времени** — извлечение определённых фрагментов с `--start-time` и `--end-time` - ✅ **Поддержка плейлистов** — пакетная обработка всех видео в плейлисте YouTube - ✅ **Резервный Vision API** — использование Claude Vision для OCR-кадров с низкой достоверностью ### 🐙 Анализ репозиториев GitHub - ✅ **Глубокий анализ кода** — AST-разбор для Python, JavaScript, TypeScript, Java, C++, Go - ✅ **Извлечение API** — функции, классы, методы с параметрами и типами - ✅ **Метаданные репозитория** — README, дерево файлов, распределение языков, звёзды/форки - ✅ **GitHub Issues и PR** — получение открытых/закрытых issues с метками и вехами - ✅ **CHANGELOG и релизы** — автоматическое извлечение истории версий - ✅ **Обнаружение конфликтов** — сравнение документированных API с фактической реализацией кода - ✅ **MCP-интеграция** — на естественном языке: «Просканируй GitHub-репозиторий facebook/react» ### 🔄 Унифицированное мультиисточниковое сканирование - ✅ **Объединение нескольких источников** — смешивайте документацию + GitHub + PDF в одном навыке - ✅ **Обнаружение конфликтов** — автоматическое нахождение расхождений между документацией и кодом - ✅ **Умное слияние** — на основе правил или с помощью ИИ - ✅ **Прозрачная отчётность** — сравнение бок о бок с предупреждениями ⚠️ - ✅ **Анализ пробелов в документации** — выявление устаревшей документации и недокументированных функций - ✅ **Единый источник истины** — один навык показывает и намерение (документация), и реальность (код) - ✅ **Обратная совместимость** — устаревшие одноисточниковые конфигурации продолжают работать ### 🤖 Поддержка нескольких LLM-платформ - ✅ **12 LLM-платформ** — Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, универсальный Markdown, OpenCode, Kimi (Moonshot AI), DeepSeek AI, Qwen (Alibaba), OpenRouter, Together AI, Fireworks AI - ✅ **Универсальное сканирование** — одна и та же документация для всех платформ - ✅ **Платформоспецифичная упаковка** — оптимизированные форматы для каждой LLM - ✅ **Экспорт одной командой** — флаг `--target` для выбора платформы - ✅ **Опциональные зависимости** — устанавливайте только то, что нужно - ✅ **100% обратная совместимость** — существующие рабочие процессы Claude без изменений | Платформа | Формат | Загрузка | Улучшение | API Key | Пользовательский эндпоинт | |-----------|--------|----------|-----------|---------|--------------------------| | **Claude AI** | ZIP + YAML | ✅ Авто | ✅ Да | ANTHROPIC_API_KEY | ANTHROPIC_BASE_URL | | **Google Gemini** | tar.gz | ✅ Авто | ✅ Да | GOOGLE_API_KEY | - | | **OpenAI ChatGPT** | ZIP + Vector Store | ✅ Авто | ✅ Да | OPENAI_API_KEY | - | | **MiniMax AI** | ZIP + Knowledge Files | ✅ Авто | ✅ Да | MINIMAX_API_KEY | - | | **Универсальный Markdown** | ZIP | ❌ Вручную | ❌ Нет | - | - | ```bash # Claude (по умолчанию — без изменений!) skill-seekers package output/react/ skill-seekers upload react.zip # Google Gemini pip install skill-seekers[gemini] skill-seekers package output/react/ --target gemini skill-seekers upload react-gemini.tar.gz --target gemini # OpenAI ChatGPT pip install skill-seekers[openai] skill-seekers package output/react/ --target openai skill-seekers upload react-openai.zip --target openai # MiniMax AI pip install skill-seekers[minimax] skill-seekers package output/react/ --target minimax skill-seekers upload react-minimax.zip --target minimax # Универсальный Markdown (универсальный экспорт) skill-seekers package output/react/ --target markdown # Используйте markdown-файлы напрямую в любой LLM ```

🔧 Используйте собственного ИИ-провайдера (OpenAI-совместимые эндпоинты + подписки, кредиты Anthropic не нужны)

Опциональный этап ИИ-**улучшения** (используется командами `create`, `scan` и `enhance`) **не** требует ключа Anthropic. Есть три способа его запустить: **1. Используйте подписку, за которую вы уже платите — вообще без API-кредитов (LOCAL-режим агента)** Skill Seekers может вызывать CLI кодинг-агента, в который вы уже вошли, поэтому улучшение работает на вашем существующем тарифе вместо оплачиваемых API-токенов: ```bash skill-seekers create --agent codex # OpenAI Codex CLI → ваш ChatGPT Plus skill-seekers create --agent claude # Claude Code → ваш Claude Pro/Max ``` Поддерживаемые агенты: `claude`, `codex`, `copilot`, `opencode`, `kimi` и `custom` (сочетайте `--agent custom` с `--agent-cmd " ..."`, чтобы использовать любой другой инструмент). **2. Любой OpenAI-совместимый провайдер (OpenRouter, Groq, Cerebras, Mistral, NVIDIA NIM, …)** Все они предоставляют OpenAI-совместимый эндпоинт `/v1`. Направьте Skill Seekers на один из них с помощью трёх переменных окружения — он обнаруживает `OPENAI_API_KEY`, а OpenAI SDK автоматически учитывает `OPENAI_BASE_URL`: ```bash export OPENAI_API_KEY="" export OPENAI_BASE_URL="https://openrouter.ai/api/v1" # эндпоинт провайдера (см. таблицу) export OPENAI_MODEL="" # обязательно — модель по умолчанию gpt-4o в других местах не существует skill-seekers create ``` | Провайдер | `OPENAI_BASE_URL` | |--------------|--------------------------------------------| | OpenRouter | `https://openrouter.ai/api/v1` | | Groq | `https://api.groq.com/openai/v1` | | Cerebras | `https://api.cerebras.ai/v1` | | Mistral | `https://api.mistral.ai/v1` | | NVIDIA NIM | `https://integrate.api.nvidia.com/v1` | > Определение провайдера выбирает **первую** найденную переменную окружения с API-ключом (`ANTHROPIC_API_KEY` → `GOOGLE_API_KEY` → `OPENAI_API_KEY` → `MOONSHOT_API_KEY`). Установите `SKILL_SEEKER_PROVIDER`, чтобы принудительно выбрать конкретного провайдера, или убедитесь, что ключи с более высоким приоритетом не заданы. **3. Claude-совместимые эндпоинты (например, GLM, прокси)** ```bash export ANTHROPIC_API_KEY="your-key" export ANTHROPIC_BASE_URL="https://your-claude-compatible-endpoint/v1" ``` Google Gemini (`GOOGLE_API_KEY`) и Kimi/Moonshot (`MOONSHOT_API_KEY`) также поддерживаются нативно. Полный список, включая переопределение моделей для каждого провайдера, см. в **[Справке по переменным окружения](docs/reference/ENVIRONMENT_VARIABLES.md#llm-provider-selection)**.

[Atlas Cloud](https://www.atlascloud.ai/?utm_source=github&utm_medium=link&utm_campaign=skill_seekers) — полномодальная, OpenAI-совместимая платформа ИИ-инференса. Skill Seekers поддерживает её как цель упаковки/улучшения через `--target atlas` с `ATLAS_API_KEY`.