๐ก Semua agen terhubung melalui http://localhost:20128/v1 atau http://cloud.omniroute.online/v1 โ satu konfigurasi, model dan kuota tak terbatas
---
## ๐ค Mengapa OmniRoute?
**Berhenti membuang uang dan terus mencapai batas:**
- Kuota langganan kedaluwarsa tanpa digunakan setiap bulan
- Batas rate menghentikan Anda di tengah sesi coding
- API mahal ($20-50/bulan per penyedia)
- Perpindahan manual antar penyedia
**OmniRoute mengatasi ini:**
- โ **Maksimalkan langganan** - Pantau kuota, gunakan setiap bit sebelum reset
- โ **Fallback otomatis** - Langganan โ Kunci API โ Murah โ Gratis, tanpa downtime
- โ **Multi-akun** - Round-robin antar akun per penyedia
---
## ๐ง Dukungan
> ๐ฌ **Bergabunglah dengan komunitas kami!** [Grup WhatsApp](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t) โ Dapatkan bantuan, berbagi tips, dan tetap terupdate.
- **Website**: [omniroute.online](https://omniroute.online)
- **GitHub**: [github.com/diegosouzapw/OmniRoute](https://github.com/diegosouzapw/OmniRoute)
- **Issues**: [github.com/diegosouzapw/OmniRoute/issues](https://github.com/diegosouzapw/OmniRoute/issues)
- **WhatsApp**: [Grup Komunitas](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t)
- **Berkontribusi**: Lihat [CONTRIBUTING.md](CONTRIBUTING.md), buka PR, atau pilih `good first issue`
### ๐ Melaporkan Bug?
Saat membuka issue, jalankan perintah system-info dan lampirkan file yang dihasilkan:
```bash
npm run system-info
```
Perintah ini menghasilkan `system-info.txt` berisi versi Node.js, versi OmniRoute, detail OS, alat CLI yang terpasang (qoder, gemini, claude, codex, antigravity, droid, dll.), status Docker/PM2, dan paket sistem โ semua yang dibutuhkan untuk mereproduksi masalah Anda dengan cepat. Lampirkan file tersebut langsung ke GitHub issue Anda.
---
## ๐ Cara Kerjanya
```
โโโโโโโโโโโโโโโ
โ Your CLI โ (Claude Code, Codex, OpenClaw, Cursor, Cline...)
โ Tool โ
โโโโโโโโฌโโโโโโโ
โ http://localhost:20128/v1
โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ OmniRoute (Router Cerdas) โ
โ โข Translasi format (OpenAI โ Claude) โ
โ โข Pelacakan kuota + Embeddings + Gambarโ
โ โข Refresh token otomatis โ
โโโโโโโโฌโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ
โโโ [Tier 1: LANGGANAN] Claude Code, Codex
โ โ kuota habis
โโโ [Tier 2: KUNCI API] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, dll.
โ โ batas anggaran
โโโ [Tier 3: MURAH] GLM ($0.6/1M), MiniMax ($0.2/1M)
โ โ batas anggaran
โโโ [Tier 4: GRATIS] Qoder, Qwen, Kiro (tidak terbatas)
Hasil: Tidak pernah berhenti coding, biaya minimal
```
---
## ๐ฏ Apa yang Diselesaikan OmniRoute โ 30 Masalah Nyata & Kasus Penggunaan
> **Setiap developer yang menggunakan alat AI menghadapi masalah ini setiap hari.** OmniRoute dibangun untuk menyelesaikannya semua โ dari pembengkakan biaya hingga pemblokiran regional, dari alur OAuth yang rusak hingga operasi protokol dan observabilitas enterprise.
๐ธ 1. "Saya membayar langganan mahal tapi masih terganggu oleh batas"
Developer membayar $20โ200/bulan untuk Claude Pro, Codex Pro, atau GitHub Copilot. Meski sudah membayar, kuota memiliki batas โ 5 jam penggunaan, batas mingguan, atau batas rate per menit. Di tengah sesi coding, penyedia berhenti merespons dan developer kehilangan fokus dan produktivitas.
**Cara OmniRoute menyelesaikannya:**
- **Fallback 4-Tier Cerdas** โ Jika kuota langganan habis, secara otomatis mengarahkan ke Kunci API โ Murah โ Gratis tanpa intervensi manual
- **Pelacakan Batas Penyedia** โ Snapshot kuota yang di-cache diperbarui sesuai jadwal sisi server (default `PROVIDER_LIMITS_SYNC_INTERVAL_MINUTES=70`) dengan pembaruan manual tersedia di UI
- **Dukungan Multi-Akun** โ Beberapa akun per penyedia dengan round-robin otomatis โ saat satu habis, beralih ke berikutnya
- **Combo Kustom** โ Rantai fallback yang dapat dikustomisasi dengan 13 strategi penyeimbangan (priority, weighted, fill-first, round-robin, P2C, random, least-used, cost-optimized, strict-random, auto, lkgp, context-optimized, **context-relay**)
- **Pembangun Combo Terstruktur** โ Buat combo langkah demi langkah dengan pemilihan penyedia + model + akun yang eksplisit, termasuk penyedia berulang dan target akun tetap
- **P2C Berbasis Kuota** โ Pemilihan akun power-of-two kini mempertimbangkan kapasitas kuota, backoff, kesalahan terkini, dan penggunaan berturut-turut
- **Kuota Bisnis Codex** โ Pemantauan kuota workspace Business/Team langsung di dashboard
๐ 2. "Saya perlu menggunakan beberapa penyedia tetapi masing-masing memiliki API berbeda"
OpenAI menggunakan satu format, Claude (Anthropic) menggunakan format lain, Gemini pun berbeda lagi. Jika seorang developer ingin menguji model dari penyedia berbeda atau melakukan fallback di antara mereka, mereka perlu mengonfigurasi ulang SDK, mengganti endpoint, dan menangani format yang tidak kompatibel. Penyedia kustom (FriendLI, NIM) memiliki endpoint model non-standar.
**Cara OmniRoute menyelesaikannya:**
- **Endpoint Terpadu** โ Satu `http://localhost:20128/v1` berfungsi sebagai proxy untuk semua 100+ penyedia
- **Translasi Format** โ Otomatis dan transparan: OpenAI โ Claude โ Gemini โ Responses API
- **Sanitasi Respons** โ Menghapus field non-standar (`x_groq`, `usage_breakdown`, `service_tier`) yang merusak OpenAI SDK v1.83+
- **Normalisasi Peran** โ Mengonversi `developer` โ `system` untuk penyedia non-OpenAI; `system` โ `user` untuk GLM/ERNIE
- **Ekstraksi Tag Think** โ Mengekstrak blok `` dari model seperti DeepSeek R1 ke `reasoning_content` yang terstandarisasi
- **Output Terstruktur untuk Gemini** โ Konversi otomatis `json_schema` โ `responseMimeType`/`responseSchema`
- **`stream` default ke `false`** โ Selaras dengan spesifikasi OpenAI, menghindari SSE tak terduga di SDK Python/Rust/Go
๐ 3. "Penyedia AI saya memblokir wilayah/negara saya"
Penyedia seperti OpenAI/Codex memblokir akses dari wilayah geografis tertentu. Pengguna mendapat kesalahan seperti `unsupported_country_region_territory` saat OAuth dan koneksi API. Ini sangat membuat frustasi para developer dari negara berkembang.
**Cara OmniRoute menyelesaikannya:**
- **Konfigurasi Proxy 3-Level** โ Proxy yang dapat dikonfigurasi di 3 level: global (semua lalu lintas), per-penyedia (hanya satu penyedia), dan per-koneksi/kunci
- **Lencana Proxy Berkode Warna** โ Indikator visual: ๐ข proxy global, ๐ก proxy penyedia, ๐ต proxy koneksi, selalu menampilkan IP
- **Pertukaran Token OAuth Melalui Proxy** โ Alur OAuth juga melewati proxy, menyelesaikan masalah `unsupported_country_region_territory`
- **Uji Koneksi via Proxy** โ Uji koneksi menggunakan proxy yang dikonfigurasi (tidak ada lagi bypass langsung)
- **Dukungan SOCKS5** โ Dukungan proxy SOCKS5 penuh untuk routing keluar
- **Spoofing Sidik Jari TLS** โ Sidik jari TLS seperti browser melalui `wreq-js` untuk melewati deteksi bot
- **๐ Pencocokan Sidik Jari CLI** โ Menyusun ulang header dan field body agar sesuai dengan tanda tangan biner CLI asli, sangat mengurangi risiko pemanduan akun. IP proxy tetap dipertahankan โ Anda mendapatkan kesiluman **dan** penyamaran IP secara bersamaan
๐ 4. "Saya ingin menggunakan AI untuk coding tapi tidak punya uang"
Tidak semua orang bisa membayar $20โ200/bulan untuk langganan AI. Pelajar, developer dari negara berkembang, penghobi, dan freelancer membutuhkan akses ke model berkualitas tanpa biaya sama sekali.
**Cara OmniRoute menyelesaikannya:**
- **Ollama Cloud** โ Model Ollama yang di-host di cloud pada `api.ollama.com` dengan tier "Light usage" gratis; gunakan prefix `ollamacloud/`
- **Combo Hanya Gratis** โ Rantai `if/kimi-k2-thinking โ qw/qwen3-coder-plus` = $0/bulan tanpa downtime
- **Akses Gratis NVIDIA NIM** โ ~40 RPM akses gratis selamanya untuk 70+ model di build.nvidia.com (beralih dari kredit ke batas rate murni)
- **Strategi Optimasi Biaya** โ Strategi routing yang secara otomatis memilih penyedia termurah yang tersedia
๐ 5. "Saya perlu melindungi gateway AI saya dari akses tidak sah"
Saat mengekspos gateway AI ke jaringan (LAN, VPS, Docker), siapa pun yang memiliki alamat tersebut dapat mengonsumsi token/kuota developer. Tanpa perlindungan, API rentan terhadap penyalahgunaan, injeksi prompt, dan eksploitasi.
**Cara OmniRoute menyelesaikannya:**
- **Manajemen Kunci API** โ Pembuatan, rotasi, dan pembatasan lingkup per penyedia dengan halaman `/dashboard/api-manager` yang didedikasikan
- **Izin Tingkat Model** โ Batasi kunci API ke model tertentu (`openai/*`, pola wildcard), dengan toggle Izinkan Semua/Batasi
- **Perlindungan Endpoint API** โ Wajibkan kunci untuk `/v1/models` dan blokir penyedia tertentu dari daftar
- **Auth Guard + Perlindungan CSRF** โ Semua rute dashboard dilindungi dengan middleware `withAuth` + token CSRF
- **Pembatas Rate** โ Pembatasan rate per-IP dengan jendela yang dapat dikonfigurasi
- **Penyaringan IP** โ Allowlist/blocklist untuk kontrol akses
- **Penjaga Injeksi Prompt** โ Sanitasi terhadap pola prompt berbahaya
- **Enkripsi AES-256-GCM** โ Kredensial dienkripsi saat disimpan
๐ 6. "Penyedia saya mati dan saya kehilangan alur coding"
Penyedia AI bisa menjadi tidak stabil, mengembalikan kesalahan 5xx, atau mencapai batas rate sementara. Jika developer bergantung pada satu penyedia, mereka akan terganggu. Tanpa circuit breaker, percobaan ulang berulang dapat menyebabkan aplikasi crash.
**Cara OmniRoute menyelesaikannya:**
- **Antrian & Pacing Permintaan** โ Bucket permintaan per-koneksi memperhalus lonjakan sebelum mencapai batas rate upstream
- **Pendinginan Koneksi** โ Satu koneksi mendingin setelah kegagalan yang dapat dicoba ulang dengan petunjuk `Retry-After` upstream opsional dan backoff eksponensial
- **Circuit Breaker Penyedia** โ Penyedia hanya trip setelah fallback habis dan permintaan penyedia masih gagal dengan kesalahan transien seluruh penyedia; batas rate `429` yang terikat koneksi tetap di Pendinginan Koneksi
- **Tunggu Pendinginan** โ Server dapat menunggu pendinginan koneksi paling awal berakhir dan mencoba ulang permintaan klien yang sama secara otomatis
- **Anti-Thundering Herd** โ Perlindungan mutex + semaphore terhadap badai percobaan ulang bersamaan
- **Rantai Fallback Combo** โ Jika penyedia utama gagal, secara otomatis jatuh ke rantai berikutnya tanpa intervensi
- **Dashboard Kesehatan** โ Pemantauan uptime, status circuit breaker penyedia, pendinginan, statistik cache, latensi p50/p95/p99
๐ง 7. "Mengonfigurasi setiap alat AI membosankan dan berulang"
**Cara OmniRoute menyelesaikannya:**
- **Dashboard Alat CLI** โ Halaman khusus dengan pengaturan satu klik untuk Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
- **Generator Konfigurasi GitHub Copilot** โ Menghasilkan `chatLanguageModels.json` untuk VS Code dengan pemilihan model massal
- **Wizard Orientasi** โ Pengaturan terpandu 4 langkah untuk pengguna pertama kali
- **Satu endpoint, semua model** โ Konfigurasi `http://localhost:20128/v1` sekali, akses 100+ penyedia
๐ 8. "Mengelola token OAuth dari beberapa penyedia adalah mimpi buruk"
**Cara OmniRoute menyelesaikannya:**
- **Refresh Token Otomatis** โ Token OAuth diperbarui di latar belakang sebelum kedaluwarsa
- **OAuth Multi-Akun** โ Beberapa akun per penyedia melalui ekstraksi token JWT/ID
- **Perbaikan OAuth LAN/Jarak Jauh** โ Deteksi IP privat untuk `redirect_uri` + mode URL manual untuk server jarak jauh
- **OAuth di Balik Nginx** โ Menggunakan `window.location.origin` untuk kompatibilitas reverse proxy
- **Panduan OAuth Jarak Jauh** โ Panduan langkah demi langkah untuk kredensial Google Cloud di VPS/Docker
๐ 9. "Saya tidak tahu berapa banyak yang saya belanjakan atau di mana"
Developer menggunakan beberapa penyedia berbayar tetapi tidak memiliki tampilan pengeluaran yang terpadu. Setiap penyedia memiliki dashboard penagihan sendiri, tetapi tidak ada tampilan konsolidasi. Biaya tak terduga bisa menumpuk.
**Cara OmniRoute menyelesaikannya:**
- **Dashboard Analitik Biaya** โ Pelacakan biaya per-token dan manajemen anggaran per penyedia
- **Batas Anggaran per Tier** โ Batas pengeluaran per tier yang memicu fallback otomatis
- **Konfigurasi Harga Per-Model** โ Harga yang dapat dikonfigurasi per model
- **Statistik Penggunaan Per Kunci API** โ Jumlah permintaan dan cap waktu terakhir digunakan per kunci
- **Dashboard Analitik** โ Kartu statistik, grafik penggunaan model, tabel penyedia dengan tingkat keberhasilan dan latensi
๐ 10. "Saya tidak dapat mendiagnosis kesalahan dan masalah dalam panggilan AI"
Saat panggilan gagal, pengembang tidak mengetahui apakah itu batas kecepatan, token kedaluwarsa, format salah, atau kesalahan penyedia. Log terfragmentasi di terminal yang berbeda. Tanpa observabilitas, debugging adalah trial-and-error.
**Bagaimana OmniRoute menyelesaikannya:**
- **Dasbor Log Terpadu** โ 4 tab: Log Permintaan, Log Proksi, Log Audit, Konsol
- **Penampil Log Konsol** โ Penampil gaya terminal real-time dengan level kode warna, gulir otomatis, pencarian, filter
- **Log Ringkasan SQLite** โ Indeks log permintaan dan proksi tetap dapat dikueri saat restart tanpa memuat blob payload besar ke SQLite
- **Translator Playground** โ 4 mode debugging: Playground (terjemahan format), Chat Tester (pulang pergi), Test Bench (batch), Live Monitor (real-time)
- **Telemetri Permintaan** โ latensi p50/p95/p99 + penelusuran X-Request-Id
- **Artefak Detail Berbasis File** โ Log aplikasi dirotasi berdasarkan ukuran, hari penyimpanan, dan jumlah arsip; payload permintaan/respons terperinci ada di `DATA_DIR/call_logs/` dan diputar secara independen dari ringkasan SQLite
- **Laporan Info Sistem** โ `npm run system-info` menghasilkan `system-info.txt` dengan lingkungan lengkap Anda (versi Node, versi OmniRoute, OS, alat CLI, status Docker/PM2). Lampirkan saat melaporkan masalah untuk triase instan.
๐๏ธ 11. "Menyebarkan dan memelihara gateway itu rumit"
Menginstal, mengonfigurasi, dan memelihara proksi AI di berbagai lingkungan (lokal, VPS, Docker, cloud) membutuhkan banyak tenaga. Masalah seperti jalur hardcode, `EACCES` pada direktori, konflik port, dan pembangunan lintas platform menambah gesekan.
**Bagaimana OmniRoute menyelesaikannya:**
- **instal global npm** โ `npm install -g omniroute && omniroute` โ selesai
- **Docker Multi-Platform** โ asli AMD64 + ARM64 (Apple Silicon, AWS Graviton, Raspberry Pi)
- **Docker Compose Profiles** โ `base` (tanpa alat CLI) dan `cli` (dengan Claude Code, Codex, OpenClaw)
- **Aplikasi Desktop Electron** โ Aplikasi asli untuk Windows/macOS/Linux dengan baki sistem, mulai otomatis, mode offline
- **Mode Port Terpisah** โ API dan Dasbor pada port terpisah untuk skenario tingkat lanjut (proksi terbalik, jaringan kontainer)
- **Cloud Sync** โ Konfigurasi sinkronisasi antar perangkat melalui Cloudflare Workers
- **DB Backups** โ Pencadangan otomatis, pemulihan, ekspor dan impor semua pengaturan, dengan `DISABLE_SQLITE_AUTO_BACKUP` untuk pencadangan yang dikelola secara eksternal
๐ 12. "Antarmuka hanya berbahasa Inggris dan tim saya tidak bisa berbahasa Inggris"
Tim di negara-negara yang tidak berbahasa Inggris, khususnya di Amerika Latin, Asia, dan Eropa, kesulitan dengan antarmuka yang hanya berbahasa Inggris. Hambatan bahasa mengurangi adopsi dan meningkatkan kesalahan konfigurasi.
**Bagaimana OmniRoute menyelesaikannya:**
- **Dasbor i18n โ 30 Bahasa** โ 500+ tombol diterjemahkan termasuk Arab, Bulgaria, Denmark, Jerman, Spanyol, Finlandia, Prancis, Ibrani, Hindi, Hungaria, Indonesia, Italia, Jepang, Korea, Melayu, Belanda, Norwegia, Polandia, Portugis (PT/BR), Rumania, Rusia, Slovakia, Swedia, Thailand, Ukraina, Vietnam, China, Filipina, Inggris
- **Dukungan RTL** โ Dukungan kanan ke kiri untuk bahasa Arab dan Ibrani
- **README Multi-Bahasa** โ 30 terjemahan dokumentasi lengkap
- **Pemilih Bahasa** โ Ikon bola dunia di header untuk peralihan waktu nyata
๐ 13. "Saya memerlukan lebih dari sekedar chat โ saya memerlukan embeddings, gambar, audio"
AI bukan hanya penyelesaian obrolan. Pengembang perlu membuat gambar, mentranskripsikan audio, membuat penyematan untuk RAG, mengubah peringkat dokumen, dan memoderasi konten. Setiap API memiliki titik akhir dan format yang berbeda.
**Bagaimana OmniRoute menyelesaikannya:**
- **Sematan** โ `/v1/embeddings` dengan 6 penyedia dan 9+ model
- **Pembuatan Gambar** โ `/v1/images/generations` dengan 10 penyedia dan 20+ model (OpenAI, xAI, Together, Fireworks, Nebius, Hyperbolic, NanoBanana, Antigravity, SD WebUI, ComfyUI)
- **Teks-ke-Video** โ `/v1/videos/generations` โ ComfyUI (AnimateDiff, SVD) dan SD WebUI
- **Teks-ke-Musik** โ `/v1/music/generations` โ ComfyUI (Audio Terbuka Stabil, MusicGen)
- **Transkripsi Audio** โ `/v1/audio/transcriptions` โ Whisper + Nvidia NIM, HuggingFace, Qwen3
- **Text-to-Speech** โ `/v1/audio/speech` โ ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise, Qwen3, **Inworld**, **Cartesia**, **PlayHT**, + penyedia yang ada
- **Moderasi** โ `/v1/moderations` โ Pemeriksaan keamanan konten
- **Pemeringkatan ulang** โ `/v1/rerank` โ Pemeringkatan ulang relevansi dokumen
- **Respon API** โ Dukungan penuh `/v1/responses` untuk Codex
๐งช 14. "Saya tidak punya cara untuk menguji dan membandingkan kualitas antar model"
Pengembang ingin mengetahui model mana yang terbaik untuk kasus penggunaan mereka โ kode, terjemahan, penalaran โ tetapi membandingkan secara manual itu lambat. Tidak ada alat evaluasi terintegrasi.
**Bagaimana OmniRoute menyelesaikannya:**
- **Evaluasi LLM** โ Pengujian set emas dengan 10 kasus yang dimuat sebelumnya yang mencakup salam, matematika, geografi, pembuatan kode, kepatuhan JSON, terjemahan, penurunan harga, penolakan keamanan
- **4 Strategi Pertandingan** โ `exact`, `contains`, `regex`, `custom` (fungsi JS)
- **Bangku Tes Taman Bermain Penerjemah** โ Pengujian batch dengan banyak masukan dan keluaran yang diharapkan, perbandingan lintas penyedia
- **Penguji Obrolan** โ Perjalanan bolak-balik penuh dengan rendering respons visual
- **Monitor Langsung** โ Aliran real-time dari semua permintaan yang mengalir melalui proxy
๐ 15. "Saya perlu meningkatkan skala tanpa kehilangan performa"
Seiring bertambahnya volume permintaan, tanpa menyimpan pertanyaan yang sama akan menghasilkan biaya duplikat. Tanpa idempotensi, permintaan duplikat akan membuang-buang pemrosesan. Batasan tarif per penyedia harus dipatuhi.
**Bagaimana OmniRoute menyelesaikannya:**
- **Cache Semantik** โ Cache dua tingkat (tanda tangan + semantik) mengurangi biaya dan latensi
- **Request Idempoency** โ Jendela deduplikasi 5 detik untuk permintaan yang identik
- **Deteksi Batas Tarif** โ RPM per penyedia, selisih minimum, dan pelacakan serentak maks
- **Antrian & Kecepatan Permintaan** โ Antrean, kecepatan, dan kecepatan konkurensi yang dapat dikonfigurasi secara default di Pengaturan โ Ketahanan
- **Cache Validasi Kunci API** โ cache 3 tingkat untuk kinerja produksi
- **Dasbor Kesehatan dengan Telemetri** โ latensi p50/p95/p99, statistik cache, waktu aktif
๐ค 16. "Saya ingin mengontrol perilaku model secara global"
Pengembang yang menginginkan semua respons dalam bahasa tertentu, dengan nada tertentu, atau ingin membatasi token penalaran. Mengonfigurasi ini di setiap alat/permintaan tidak praktis.
**Bagaimana OmniRoute menyelesaikannya:**
- **Injeksi Perintah Sistem** โ Perintah global diterapkan ke semua permintaan
- **Validasi Anggaran Berpikir** โ Kontrol alokasi token penalaran per permintaan (passthrough, otomatis, kustom, adaptif)
- **9 Strategi Perutean** โ Strategi global yang menentukan cara permintaan didistribusikan
- **Wildcard Router** โ pola `provider/*` merutekan secara dinamis ke penyedia mana pun
- **Combo Aktifkan/Nonaktifkan Toggle** โ Beralih kombo langsung dari dasbor
- **Pengurutan Kombo Manual** โ Seret kartu kombo berdasarkan pegangan dan pertahankan pesanan di SQLite
- **Toggle Penyedia** โ Mengaktifkan/menonaktifkan semua koneksi untuk penyedia dengan satu klik
- **Penyedia yang Diblokir** โ Kecualikan penyedia tertentu dari daftar `/v1/models`
๐งฐ 17. "Saya membutuhkan alat MCP sebagai kemampuan produk kelas satu"
Many AI gateways expose MCP only as a hidden implementation detail. Teams need a visible, manageable operation layer.
**Bagaimana OmniRoute menyelesaikannya:**
- MCP muncul di navigasi dasbor dan tab protokol titik akhir
- Halaman manajemen MCP khusus dengan proses, alat, cakupan, dan audit
- Mulai cepat bawaan untuk `omniroute --mcp` dan orientasi klien
๐ง 18. "Saya memerlukan orkestrasi A2A dengan jalur tugas sinkronisasi + streaming"
Alur kerja agen memerlukan balasan langsung dan eksekusi streaming jangka panjang dengan kontrol siklus hidup.
**Bagaimana OmniRoute menyelesaikannya:**
- Titik akhir A2A JSON-RPC (`POST /a2a`) dengan `message/send` dan `message/stream`
- Streaming SSE dengan propagasi status terminal
- API siklus hidup tugas untuk `tasks/get` dan `tasks/cancel`
๐ฐ๏ธ 19. "Saya membutuhkan kesehatan proses MCP yang nyata, bukan status yang dapat ditebak"
Tim operasional perlu mengetahui apakah MCP benar-benar aktif, bukan hanya apakah API dapat dijangkau.
**Bagaimana OmniRoute menyelesaikannya:**
- File detak jantung runtime dengan PID, stempel waktu, transportasi, jumlah alat, dan mode cakupan
- API status MCP menggabungkan detak jantung + aktivitas terkini
- Kartu status UI untuk kesegaran proses/waktu aktif/detak jantung
๐ 20. "Saya memerlukan eksekusi alat MCP yang dapat diaudit"
Saat alat mengubah konfigurasi atau memicu tindakan operasi, tim memerlukan kemampuan penelusuran forensik.
**Bagaimana OmniRoute menyelesaikannya:**
- Pencatatan audit yang didukung SQLite untuk panggilan alat MCP
- Filter berdasarkan alat, keberhasilan/kegagalan, kunci API, dan penomoran halaman
- Tabel audit dasbor + titik akhir statistik untuk otomatisasi
๐ 21. "Saya memerlukan izin MCP terbatas per integrasi"
Different clients should have least-privilege access to tool categories.
**Bagaimana OmniRoute menyelesaikannya:**
- 10 cakupan MCP granular untuk akses alat terkontrol
- Penegakan cakupan dan visibilitas di UI manajemen MCP
- Postur default yang aman untuk perkakas operasional
โ๏ธ 22. "Saya memerlukan kontrol operasional tanpa memindahkan"
Tim memerlukan perubahan runtime yang cepat selama insiden atau peristiwa biaya.
**Bagaimana OmniRoute menyelesaikannya:**
- Beralih aktivasi kombo langsung dari dasbor MCP
- Sesuaikan pengaturan antrean, cooldown, pemutus, dan tunggu dari halaman Ketahanan khusus
- Tinjau status pemutus penyedia langsung dari dasbor Kesehatan
๐ 23. "Saya memerlukan visibilitas dan pembatalan siklus hidup tugas A2A langsung"
Without lifecycle visibility, task incidents become hard to triage.
**Bagaimana OmniRoute menyelesaikannya:**
- Daftar tugas/pemfilteran berdasarkan status/keterampilan dengan penomoran halaman
- Telusuri metadata tugas, peristiwa, dan artefak
- Titik akhir pembatalan tugas dan tindakan UI dengan konfirmasi
๐ 24. "Saya memerlukan metrik aliran aktif untuk memuat A2A"
Alur kerja streaming memerlukan wawasan operasional tentang konkurensi dan koneksi langsung.
**Bagaimana OmniRoute menyelesaikannya:**
- Penghitung aliran aktif terintegrasi ke dalam status A2A
- Stempel waktu tugas terakhir dan jumlah per negara bagian
- Kartu dasbor A2A untuk pemantauan operasi waktu nyata
๐ชช 25. "Saya memerlukan penemuan agen standar untuk klien"
Klien dan orkestra eksternal memerlukan metadata yang dapat dibaca mesin untuk orientasi.
**Bagaimana OmniRoute menyelesaikannya:**
- Kartu Agen terungkap di `/.well-known/agent.json`
- Kemampuan dan keterampilan yang ditunjukkan dalam manajemen UI
- API status A2A mencakup metadata penemuan untuk otomatisasi
๐งญ 26. "Saya memerlukan kemampuan protokol untuk ditemukan di UX produk"
If users cannot discover protocol surfaces, adoption and support quality drop.
**Bagaimana OmniRoute menyelesaikannya:**
- Halaman **Endpoint** terkonsolidasi dengan tab untuk Proxy, MCP, A2A, dan API Endpoints
- Pengalih status layanan inline (Online/Offline) untuk MCP dan A2A
- Tautan dari ikhtisar ke tab manajemen khusus
๐งช 27. "Saya memerlukan validasi protokol end-to-end dengan klien nyata"
Mock tests are not enough to validate protocol compatibility before release.
**Bagaimana OmniRoute menyelesaikannya:**
- Suite E2E yang mem-boot aplikasi dan menggunakan transportasi klien MCP SDK yang sebenarnya
- Klien A2A menguji penemuan, pengiriman, streaming, dapatkan, dan pembatalan aliran
- Periksa silang pernyataan terhadap audit MCP dan API tugas A2A
๐ก 28. "Saya memerlukan observabilitas terpadu di semua antarmuka"
Splitting observability by protocol creates blind spots and longer MTTR.
**Bagaimana OmniRoute menyelesaikannya:**
- Dasbor/log/analitik terpadu dalam satu produk
- Kesehatan + audit + permintaan telemetri di seluruh lapisan OpenAI, MCP, dan A2A
- API Operasional untuk status dan otomatisasi
๐ผ 29. "Saya memerlukan satu runtime untuk proxy + alat + orkestrasi agen"
Menjalankan banyak layanan terpisah akan meningkatkan biaya operasional dan mode kegagalan.
**Bagaimana OmniRoute menyelesaikannya:**
- Proksi yang kompatibel dengan OpenAI, server MCP, dan server A2A dalam satu tumpukan
- Otentikasi bersama, ketahanan, penyimpanan data, dan kemampuan observasi
- Model kebijakan yang konsisten di seluruh platform interaksi
๐ 30. "Saya perlu mengirim workflow agentic tanpa tumpukan glue code"
Tim kehilangan kecepatan saat menggabungkan beberapa layanan dan skrip ad-hoc.
**Bagaimana OmniRoute menyelesaikannya:**
- Strategi titik akhir terpadu untuk klien dan agen
- UI manajemen protokol bawaan dan jalur validasi asap
- Fondasi siap produksi (keamanan, logging, ketahanan, cadangan)
๐ 31. "Sesi panjang saya crash karena batas 'context_length_exceeded'"
Selama proses debug mendalam, riwayat panjang dengan hasil alat dengan cepat melampaui jendela token penyedia, menyebabkan permintaan gagal dan konteks tidak ada lagi.
**Bagaimana OmniRoute menyelesaikannya:**
- **Kompresi Konteks Proaktif** โ Mengevaluasi anggaran token sebelum permintaan mencapai hulu dan secara proaktif memangkas riwayat percakapan lama dengan mekanisme pencarian biner yang cerdas.
- **Pengaman Integritas Struktural** โ Secara otomatis melacak definisi `tool_use` yang eksplisit dan memastikan bahwa jika masukan alat terpotong, `tool_result` yang terkait juga dihapus dengan aman, sehingga mencegah kesalahan validasi API.
- **Penghapusan Multi-Lapisan** โ Secara progresif menghapus pesan sistem, pesan biasa, dan akhirnya menerapkan batas panjang yang ketat tanpa merusak logika percakapan.
### Contoh Playbook (Kasus Penggunaan Terintegrasi)
**Playbook A: Maximize paid subscription + cheap backup**
```txt
Combo: "maximize-claude"
1. cc/claude-opus-4-7
2. glm/glm-4.7
3. if/kimi-k2-thinking
Monthly cost: $20 + small backup spend
Outcome: higher quality, near-zero interruption
```
**Playbook B: Tumpukan coding tanpa biaya**
```txt
Combo: "free-forever"
1. if/kimi-k2-thinking (unlimited free)
2. qw/qwen3-coder-plus (unlimited free)
Monthly cost: $0
Outcome: stable free coding workflow
```
**Playbook C: Rantai fallback yang selalu aktif 24/7**
```txt
Combo: "always-on"
1. cc/claude-opus-4-7
2. cx/gpt-5.2-codex
3. glm/glm-4.7
4. minimax/MiniMax-M2.1
5. if/kimi-k2-thinking
Outcome: deep fallback depth for deadline-critical workloads
```
**Playbook D: Operasi agen dengan MCP + A2A**
```txt
1) Start MCP transport (`omniroute --mcp`) for tool-driven operations
2) Run A2A tasks via `message/send` and `message/stream`
3) Observe via /dashboard/endpoint (MCP and A2A tabs)
4) Toggle services via inline status controls
```
---
## ๐ Mulai Gratis โ Tanpa Biaya Konfigurasi
> Siapkan pengkodean AI dalam hitungan menit di **$0/bulan**. Hubungkan akun gratis ini dan gunakan kombo **Free Stack** bawaan.
| Step | Action | Providers Unlocked |
| ---- | -------------------------------------------------- | ------------------------------------------------------------------ |
| 1 | Connect **Kiro** (AWS Builder ID OAuth) | Claude Sonnet 4.5, Haiku 4.5 โ **unlimited** |
| 2 | Connect **Qoder** (Google OAuth) | kimi-k2-thinking, qwen3-coder-plus, deepseek-r1... โ **unlimited** |
| 3 | Connect **Qwen** (Device Code) | qwen3-coder-plus, qwen3-coder-flash... โ **unlimited** |
| 4 | `/dashboard/combos` โ **Templat Tumpukan Gratis ($0)** | Round-robin semua penyedia gratis secara otomatis |
**Arahkan IDE/CLI apa pun ke:** `http://localhost:20128/v1` ยท Kunci API: `any-string` ยท Selesai.
> **Cakupan ekstra opsional (juga gratis):** Kunci API Groq (gratis 30 RPM), NVIDIA NIM (gratis 40 RPM, 70+ model), Cerebras (1 juta tok/hari), kunci API LongCat (50 juta token/hari!), Cloudflare Workers AI (10 ribu neuron/hari, 50+ model).
## Mulai Cepat
### 1) Instal dan jalankan
```bash
npm install -g omniroute
omniroute
```
> **pengguna pnpm:** Jalankan `pnpm approve-builds -g` setelah instalasi untuk mengaktifkan skrip build asli yang diperlukan oleh `better-sqlite3` dan `@swc/core`:
>
> ```bash
> pnpm install -g omniroute
> pnpm approve-builds -g # Pilih semua paket โ approve
> omniroute
> ```
Dasbor terbuka di `http://localhost:20128` dan URL dasar API adalah `http://localhost:20128/v1`.
#### Arch Linux (AUR)
Pengguna Arch Linux dapat menginstal [AUR package](https://aur.archlinux.org/packages/omniroute-bin), yang menginstal OmniRoute dan menyediakan layanan pengguna systemd:
```bash
yay -S omniroute-bin
systemctl --user enable --now omniroute.service
```
| Command | Description |
| ----------------------- | ----------------------------------------------------------- |
| `omniroute` | Mulai server (`PORT=20128`, API dan dasbor pada port yang sama) |
| `omniroute --port 3000` | Set canonical/API port to 3000 |
| `omniroute --mcp` | Mulai server MCP (stdio transport) |
| `omniroute --no-open` | Don't auto-open browser |
| `omniroute --help` | Show help |
Optional split-port mode:
```bash
PORT=20128 DASHBOARD_PORT=20129 omniroute
# API: http://localhost:20128/v1
# Dashboard: http://localhost:20129
```
### 2) Menghapus Instalasi
Saat Anda tidak lagi memerlukan OmniRoute, kami menyediakan dua skrip cepat untuk penghapusan bersih:
| Command | Action |
| ------------------------ | ----------------------------------------------------------------------------------- |
| `npm run uninstall` | Menghapus aplikasi sistem tetapi **menyimpan DB dan konfigurasi Anda** di `~/.omniroute`. |
| `npm run uninstall:full` | Menghapus aplikasi DAN secara permanen **menghapus semua konfigurasi, kunci, dan database**. |
> Catatan: Untuk menjalankan perintah ini, navigasikan ke folder proyek OmniRoute (jika Anda mengkloningnya) dan jalankan. Alternatifnya, jika diinstal secara global, Anda cukup menjalankan `npm uninstall -g omniroute`.
### Batas Waktu Streaming yang Berlangsung Lama
Untuk sebagian besar penerapan, Anda hanya memerlukan:
| Variable | Default | Purpose |
| ------------------------ | ----------------------------- | -------------------------------------------------------------------------------------------------------------------------------------------- |
| `REQUEST_TIMEOUT_MS` | `600000` | Garis dasar bersama untuk batas waktu mulai respons upstream, batas waktu Undici yang tersembunyi, permintaan sidik jari TLS, dan batas waktu permintaan/proksi jembatan API |
| `STREAM_IDLE_TIMEOUT_MS` | inherits `REQUEST_TIMEOUT_MS` | Kesenjangan maksimum antara potongan streaming sebelum OmniRoute membatalkan aliran SSE |
Kompatibilitas mundur dipertahankan: `FETCH_TIMEOUT_MS`, `API_BRIDGE_PROXY_TIMEOUT_MS`, dan var batas waktu per lapisan lainnya yang ada masih berfungsi dan menggantikan garis dasar bersama.
Untuk upstream yang kompatibel dengan Kode Claude (`anthropic-compatible-cc-*`), OmniRoute juga memperoleh header `X-Stainless-Timeout` keluar dari batas waktu pengambilan yang diselesaikan sehingga batas waktu baca sisi penyedia tetap selaras dengan konfigurasi env Anda.
Untuk reverse proxy pihak ketiga yang kompatibel dengan Claude Code, OmniRoute tetap menggunakan default
`anthropic-beta` disetel konservatif dan, ketika `Client Cache Control` tersisa di `Auto`,
hanya meneruskan penanda `cache_control` yang disediakan klien. Jika permintaan tidak menyertakan
`cache_control`, OmniRoute tidak memasukkan penanda milik jembatan.
Penggantian tingkat lanjut tersedia jika Anda memerlukan kontrol yang lebih baik:
| Variable | Default | Purpose |
| ---------------------------------------- | ------------------------------------------ | -------------------------------------------------------------------- |
| `FETCH_TIMEOUT_MS` | inherits `REQUEST_TIMEOUT_MS` | Batas waktu mulai respons hulu digunakan hingga header respons tiba |
| `FETCH_HEADERS_TIMEOUT_MS` | inherits `FETCH_TIMEOUT_MS` | Batas waktu Undici untuk menerima header respons upstream |
| `FETCH_BODY_TIMEOUT_MS` | inherits `FETCH_TIMEOUT_MS` | Undici time limit between upstream body chunks (`0` disables it) |
| `FETCH_CONNECT_TIMEOUT_MS` | `30000` | Undici TCP connect timeout |
| `FETCH_KEEPALIVE_TIMEOUT_MS` | `4000` | Undici idle keep-alive socket timeout |
| `TLS_CLIENT_TIMEOUT_MS` | inherits `FETCH_TIMEOUT_MS` | Batas waktu untuk permintaan sidik jari TLS yang dilakukan melalui `wreq-js` |
| `API_BRIDGE_PROXY_TIMEOUT_MS` | inherits `REQUEST_TIMEOUT_MS` or `600000` | Batas waktu untuk penerusan proxy `/v1` dari port API ke port dasbor |
| `API_BRIDGE_SERVER_REQUEST_TIMEOUT_MS` | `max(API_BRIDGE_PROXY_TIMEOUT_MS, 300000)` | Batas waktu permintaan masuk di server jembatan API |
| `API_BRIDGE_SERVER_HEADERS_TIMEOUT_MS` | `60000` | Batas waktu header masuk di server jembatan API |
| `API_BRIDGE_SERVER_KEEPALIVE_TIMEOUT_MS` | `5000` | Batas waktu tetap hidup di server jembatan API|
| `API_BRIDGE_SERVER_SOCKET_TIMEOUT_MS` | `0` |Batas waktu ketidakaktifan soket di server jembatan API (`0` menonaktifkannya) |
Untuk permintaan streaming, `FETCH_TIMEOUT_MS` hanya mencakup pengaturan koneksi/menunggu respons upstream pertama. Setelah aliran aktif, OmniRoute hanya akan dibatalkan pada keadaan terhenti sebenarnya (`STREAM_IDLE_TIMEOUT_MS`) atau tubuh Undici tidak aktif (`FETCH_BODY_TIMEOUT_MS`).
Jika Anda menjalankan OmniRoute di belakang Nginx, Caddy, Cloudflare, atau proksi terbalik lainnya, pastikan proksi tersebut
waktu tunggu juga lebih tinggi daripada waktu tunggu aliran/pengambilan OmniRoute Anda.
### 2) Hubungkan penyedia dan buat kunci API Anda
1. Buka Dasbor โ `Providers` dan sambungkan setidaknya satu penyedia (OAuth atau kunci API).
2. Buka Dasbor โ `Endpoints` dan buat kunci API.
3. (Opsional) Buka Dasbor โ `Combos` dan atur rantai cadangan Anda.
### 3) Arahkan alat pengkodean Anda ke OmniRoute
```txt
Base URL: http://localhost:20128/v1
API Key: [copy from Endpoint page]
Model: if/kimi-k2-thinking (or any provider/model prefix)
```
### 4) Mengaktifkan dan memvalidasi protokol (v2.0)
**MCP (untuk operasi yang digerakkan oleh alat):**
```bash
omniroute --mcp
```
Kemudian sambungkan klien MCP Anda melalui `stdio` dan uji alat seperti:
- `omniroute_get_health`
- `omniroute_list_combos`
**A2A (untuk alur kerja agen-ke-agen):**
```bash
curl http://localhost:20128/.well-known/agent.json
```
```bash
curl -X POST http://localhost:20128/a2a \
-H 'content-type: application/json' \
-d '{"jsonrpc":"2.0","id":"quickstart","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Give me a short quota summary."}]}}'
```
### 5) Validasi semuanya end-to-end (direkomendasikan)
```bash
npm run test:protocols:e2e
```
Suite ini memvalidasi alur klien MCP dan A2A yang sebenarnya terhadap aplikasi yang sedang berjalan.
### Alternatif: dijalankan dari sumber
```bash
cp .env.example .env
npm install
PORT=20128 DASHBOARD_PORT=20129 NEXT_PUBLIC_BASE_URL=http://localhost:20129 npm run dev
```
Void Linux (`xbps-src` template)
Untuk pengguna Void Linux, Anda dapat membuat paket asli menggunakan `xbps-src`. Simpan blok ini sebagai `srcpkgs/omniroute/template`:
```bash
# Template file for 'omniroute'
pkgname=omniroute
version=3.4.1
revision=1
hostmakedepends="nodejs python3 make"
depends="openssl"
short_desc="Universal AI gateway with smart routing for multiple LLM providers"
maintainer="zenobit "
license="MIT"
homepage="https://github.com/diegosouzapw/OmniRoute"
distfiles="https://github.com/diegosouzapw/OmniRoute/archive/refs/tags/v${version}.tar.gz"
checksum=009400afee90a9f32599d8fe734145cfd84098140b7287990183dde45ae2245b
system_accounts="_omniroute"
omniroute_homedir="/var/lib/omniroute"
export NODE_ENV=production
export npm_config_engine_strict=false
export npm_config_loglevel=error
export npm_config_fund=false
export npm_config_audit=false
do_build() {
# Determine target CPU arch for node-gyp
local _gyp_arch
case "$XBPS_TARGET_MACHINE" in
aarch64*) _gyp_arch=arm64 ;;
armv7*|armv6*) _gyp_arch=arm ;;
i686*) _gyp_arch=ia32 ;;
*) _gyp_arch=x64 ;;
esac
# 1) Install all deps โ skip scripts (no network in do_build, native modules
# compiled separately below; better-sqlite3 is serverExternalPackage so
# Next.js does not execute it during next build)
NODE_ENV=development npm ci --ignore-scripts
# 2) Build the Next.js standalone bundle
npm run build
# 3) Copy static assets into standalone
cp -r .next/static .next/standalone/.next/static
[ -d public ] && cp -r public .next/standalone/public || true
# 4) Compile better-sqlite3 native binding for the target architecture.
# Use node-gyp directly so CC/CXX from xbps-src cross-toolchain are used
# without npm altering them.
local _node_gyp=/usr/lib/node_modules/npm/node_modules/node-gyp/bin/node-gyp.js
(cd node_modules/better-sqlite3 && node "$_node_gyp" rebuild --arch="$_gyp_arch")
# 5) Place the compiled binding into the standalone bundle
local _bs3_release=.next/standalone/node_modules/better-sqlite3/build/Release
mkdir -p "$_bs3_release"
cp node_modules/better-sqlite3/build/Release/better_sqlite3.node "$_bs3_release/"
# 6) Remove arch-specific sharp bundles โ upstream sets images.unoptimized=true
# so sharp is not used at runtime; x64 .so files would break aarch64 strip
rm -rf .next/standalone/node_modules/@img
# 7) Copy pino runtime deps omitted by Next.js static analysis:
# pino-abstract-transport โ required by pino's worker thread
# split2 โ dep of pino-abstract-transport
# process-warning โ dep of pino itself
for _mod in pino-abstract-transport split2 process-warning; do
cp -r "node_modules/$_mod" .next/standalone/node_modules/
done
}
do_check() {
npm run test:unit
}
do_install() {
vmkdir usr/lib/omniroute/.next
vcopy .next/standalone/. usr/lib/omniroute/.next/standalone
# Prevent removal of empty Next.js app router dirs by the post-install hook
for _d in \
.next/standalone/.next/server/app/dashboard \
.next/standalone/.next/server/app/dashboard/settings \
.next/standalone/.next/server/app/dashboard/providers; do
touch "${DESTDIR}/usr/lib/omniroute/${_d}/.keep"
done
cat > "${WRKDIR}/omniroute" <<'EOF'
#!/bin/sh
export PORT="${PORT:-20128}"
export DATA_DIR="${DATA_DIR:-${XDG_DATA_HOME:-${HOME}/.local/share}/omniroute}"
export APP_LOG_TO_FILE="${APP_LOG_TO_FILE:-false}"
mkdir -p "${DATA_DIR}"
exec node /usr/lib/omniroute/.next/standalone/server.js "$@"
EOF
vbin "${WRKDIR}/omniroute"
}
post_install() {
vlicense LICENSE
}
```
---
## ๐ณ Docker
OmniRoute tersedia sebagai image Docker publik di [Docker Hub](https://hub.docker.com/r/diegosouzapw/omniroute).
**Quick run:**
```bash
docker run -d \
--name omniroute \
--restart unless-stopped \
--stop-timeout 40 \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latest
```
**Dengan file lingkungan:**
```bash
# Copy and edit .env first
cp .env.example .env
docker run -d \
--name omniroute \
--restart unless-stopped \
--stop-timeout 40 \
--env-file .env \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latest
```
**Menggunakan Docker Tulis:**
```bash
# Base profile (no CLI tools)
docker compose --profile base up -d
# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d
```
Dukungan dasbor untuk penerapan Docker kini mencakup **Cloudflare Quick Tunnel** sekali klik di `Dashboard โ Endpoints`. Yang pertama mengaktifkan pengunduhan `cloudflared` hanya bila diperlukan, memulai terowongan sementara ke titik akhir `/v1` Anda saat ini, dan menampilkan URL `https://*.trycloudflare.com/v1` yang dihasilkan langsung di bawah URL publik normal Anda.
Notes:
- URL Terowongan Cepat bersifat sementara dan berubah setelah setiap restart.
- Terowongan Cepat tidak dipulihkan secara otomatis setelah OmniRoute atau kontainer dimulai ulang. Aktifkan kembali dari dasbor bila diperlukan.
- Penginstalan terkelola saat ini mendukung Linux, macOS, dan Windows di `x64` / `arm64`.
- Terkelola Quick Tunnels default ke transportasi HTTP/2 untuk menghindari peringatan buffer UDP QUIC yang berisik di lingkungan kontainer yang terbatas. Setel `CLOUDFLARED_PROTOCOL=quic` atau `auto` jika Anda menginginkan transportasi lain.
- Gambar Docker menggabungkan akar CA sistem dan meneruskannya ke `cloudflared` yang dikelola, yang menghindari kegagalan kepercayaan TLS ketika terowongan melakukan bootstrap di dalam wadah.
- SQLite berjalan dalam mode WAL. `docker stop` harus dibiarkan selesai sehingga OmniRoute dapat memeriksa kembali perubahan terbaru ke `storage.sqlite`.
- File Compose yang dibundel sudah menetapkan masa tenggang penghentian 40 detik. Jika Anda menjalankan image secara langsung, pertahankan `--stop-timeout 40` (atau serupa) sehingga penghentian manual tidak menghentikan pembersihan pematian.
- Setel `CLOUDFLARED_BIN=/absolute/path/to/cloudflared` jika Anda ingin OmniRoute menggunakan biner yang sudah ada alih-alih mengunduhnya.
**Menggunakan Docker Compose dengan Caddy (HTTPS Auto-TLS):**
OmniRoute dapat diekspos dengan aman menggunakan penyediaan SSL otomatis Caddy. Pastikan data DNS A domain Anda mengarah ke IP server Anda.
```yaml
services:
omniroute:
image: diegosouzapw/omniroute:latest
container_name: omniroute
restart: unless-stopped
volumes:
- omniroute-data:/app/data
environment:
- PORT=20128
- NEXT_PUBLIC_BASE_URL=https://your-domain.com
caddy:
image: caddy:latest
container_name: caddy
restart: unless-stopped
ports:
- "80:80"
- "443:443"
command: caddy reverse-proxy --from https://your-domain.com --to http://omniroute:20128
volumes:
omniroute-data:
```
| Image | Tag | Size | Description |
| ------------------------ | -------- | ------ | --------------------- |
| `diegosouzapw/omniroute` | `latest` | ~250MB | Latest stable release |
| `diegosouzapw/omniroute` | `3.6.2` | ~250MB | Current version |
---
## ๐ฅ๏ธ Aplikasi Desktop โ Offline & Selalu Aktif
> ๐ **BARU!** OmniRoute kini tersedia sebagai **aplikasi desktop asli** untuk Windows, macOS, dan Linux.
Jalankan OmniRoute sebagai aplikasi desktop mandiri โ tanpa terminal, tanpa browser, tanpa internet untuk model lokal. Aplikasi berbasis Electron meliputi:
- ๐ฅ๏ธ **Jendela Asli** โ Jendela aplikasi khusus dengan integrasi baki sistem
- ๐ **Mulai Otomatis** โ Luncurkan OmniRoute saat login sistem
- ๐ **Pemberitahuan Asli** โ Dapatkan peringatan jika kuota habis atau masalah penyedia
- โก **Instal Sekali Klik** โ NSIS (Windows), DMG (macOS), AppImage (Linux)
- ๐ **Mode Offline** โ Bekerja sepenuhnya offline dengan server yang dibundel
### Mulai Cepat
```bash
# Development mode
npm run electron:dev
# Build for your platform
npm run electron:build # Current platform
npm run electron:build:win # Windows (.exe)
npm run electron:build:mac # macOS (.dmg) โ x64 & arm64
npm run electron:build:linux # Linux (.AppImage)
```
### System Tray
Saat diminimalkan, OmniRoute ada di baki sistem Anda dengan tindakan cepat:
- Buka dasbor
- Ubah port server
- Keluar dari aplikasi
๐ Full documentation: [`electron/README.md`](electron/README.md)
---
## ๐ฐ Harga Sekilas
| Tier | Provider | Cost | Quota Reset | Best For |
| ------------------- | --------------------------- | ------------------------- | ---------------- | --------------------------------- |
| **๐ณ SUBSCRIPTION** | Claude Code (Pro) | $20/mo | 5h + weekly | Already subscribed |
| | Codex (Plus/Pro) | $20-200/mo | 5h + weekly | OpenAI users |
| | GitHub Copilot | $10-19/mo | Monthly | GitHub users |
| **๐ API KEY** | NVIDIA NIM | **GRATIS** (pengembangan selamanya) | ~40 RPM | 70+ open models |
| | Cerebras | **FREE** (1M tok/day) | 60K TPM / 30 RPM | World's fastest |
| | Groq | **FREE** (30 RPM) | 14.4K RPD | Ultra-fast Llama/Gemma |
| | DeepSeek V3.2 | $0.27/$1.10 per 1M | None | Best price/quality reasoning |
| | xAI Grok-4 Fast | **$0.20/$0.50 per 1M** ๐ | None | Fastest + tool calling, ultralow |
| | xAI Grok-4 (standard) | $0.20/$1.50 per 1M ๐ | None | Penalaran andalan dari xAI |
| | Mistral | Uji coba gratis + berbayar | Rate limited | European AI |
| | OpenRouter | Bayar per penggunaan | None | 100+ models aggr. |
| **๐ฐ CHEAP** | GLM-5 (via Z.AI) ๐ | $0.5/1M | Daily 10AM | 128K output, newest flagship |
| | GLM-4.7 | $0.6/1M | Daily 10AM | Budget backup |
| | MiniMax M2.5 ๐ | $0.3/1M input | 5-hour rolling | Reasoning + agentic tasks |
| | MiniMax M2.1 | $0.2/1M | 5-hour rolling | Cheapest option |
| | Kimi K2.5 (Moonshot API) ๐ | Bayar per penggunaan | None | Direct Moonshot API access |
| | Kimi K2 | $9/mo flat | 10M tokens/mo | Predictable cost |
| **๐ FREE** | Qoder | **$0** | Unlimited | 5 models unlimited |
| | Qwen | **$0** | Unlimited | 4 models unlimited |
| | Kiro | **$0** | Unlimited | Claude Sonnet/Haiku (AWS Builder) |
| | LongCat Flash-Lite ๐ | **$0** (50M tok/day ๐ฅ) | 1 RPS | Kuota gratis terbesar di dunia |
| | Pollinations AI ๐ | **$0** (tidak perlu kunci) | 1 req/15s | GPT-5, Claude, DeepSeek, Llama 4 |
| | Cloudflare Workers AI ๐ | **$0** (10K Neurons/day) | ~150 resp/day | 50+ model, keunggulan global |
| | Scaleway AI ๐ | **$0** (1M tokens total) | Rate limited | EU/GDPR, Qwen3 235B, Llama 70B |
> ๐ **Model baru ditambahkan (Mar 2026):** Keluarga Grok-4 Fast seharga $0,20/$0,50/M (dibandingkan pada 1143ms โ 30% lebih cepat dibandingkan Gemini 2.5 Flash), GLM-5 melalui Z.AI dengan output 128K, penalaran MiniMax M2.5, harga DeepSeek V3.2 yang diperbarui, Kimi K2.5 melalui API langsung Moonshot.
**๐ก Tumpukan Kombo $0 โ Penyiapan Gratis Lengkap:**
```
# ๐ Ultimate Free Stack 2026 โ 11 Providers, $0 Forever
Kiro (kr/) โ Claude Sonnet/Haiku UNLIMITED
Qoder (if/) โ kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED
LongCat Lite (lc/) โ LongCat-Flash-Lite โ 50M tokens/day ๐ฅ
Pollinations (pol/) โ GPT-5, Claude, DeepSeek, Llama 4 โ no key needed
Qwen (qw/) โ qwen3-coder-plus, qwen3-coder-flash, qwen3-coder-next UNLIMITED
Gemini (gemini/) โ Gemini 2.5 Flash โ 1,500 req/day free API key
Cloudflare AI (cf/) โ Llama 70B, Gemma 3, Mistral โ 10K Neurons/day
Scaleway (scw/) โ Qwen3 235B, Llama 70B โ 1M free tokens (EU)
Groq (groq/) โ Llama/Gemma ultra-fast โ 14.4K req/day
NVIDIA NIM (nvidia/) โ 70+ open models โ 40 RPM forever
Cerebras (cerebras/) โ Llama/Qwen world-fastest โ 1M tok/day
```
**Tanpa biaya. Jangan pernah berhenti melakukan pengkodean.** Konfigurasikan ini sebagai satu kombo OmniRoute dan semua fallback terjadi secara otomatis โ tidak pernah ada peralihan manual.
---
---
## ๐ Model Gratis โ Apa yang Sebenarnya Anda Dapatkan
> Semua model di bawah **100% gratis tanpa memerlukan kartu kredit**. OmniRoute melakukan rute otomatis di antara keduanya ketika satu kuota habis โ gabungkan semuanya untuk kombo $0 yang tidak dapat dipecahkan.
### ๐ต MODEL CLAUDE (melalui Kiro โ ID AWS Builder)
| Model | Prefix | Limit | Rate Limit |
| ------------------- | ------ | ------------- | --------------------- |
| `claude-sonnet-4.5` | `kr/` | **Unlimited** | No reported daily cap |
| `claude-haiku-4.5` | `kr/` | **Unlimited** | No reported daily cap |
| `claude-opus-4.6` | `kr/` | **Unlimited** | Latest Opus via Kiro |
### ๐ข MODEL QODER (PAT Gratis melalui qodercli)
| Model | Prefix | Limit | Rate Limit |
| ------------------ | ------ | ------------- | --------------- |
| `kimi-k2-thinking` | `if/` | **Unlimited** | No reported cap |
| `qwen3-coder-plus` | `if/` | **Unlimited** | No reported cap |
| `deepseek-r1` | `if/` | **Unlimited** | No reported cap |
| `minimax-m2.1` | `if/` | **Unlimited** | No reported cap |
| `kimi-k2` | `if/` | **Unlimited** | No reported cap |
> Metode koneksi yang disarankan: **Token Akses Pribadi + `qodercli`**. Peramban OAuth adalah
> eksperimental dan dinonaktifkan secara default kecuali variabel lingkungan `QODER_OAUTH_*` dikonfigurasi.
### ๐ก MODEL QWEN (Otentikasi Kode Perangkat)
| Model | Prefix | Limit | Rate Limit |
| ------------------- | ------ | ------------- | ------------------- |
| `qwen3-coder-plus` | `qw/` | **Unlimited** | No reported cap |
| `qwen3-coder-flash` | `qw/` | **Unlimited** | No reported cap |
| `qwen3-coder-next` | `qw/` | **Unlimited** | No reported cap |
| `vision-model` | `qw/` | **Unlimited** | Multimodal (images) |
### โซ NVIDIA NIM (Kunci API Gratis โ build.nvidia.com)
| Tier | Daily Limit | Rate Limit | Notes |
| ---------- | ------------ | ----------- | ------------------------------------------------------ |
| Free (Dev) | No token cap | **~40 RPM** | 70+ model; transisi ke batas tarif murni pada pertengahan tahun 2025 |
Model gratis populer: `moonshotai/kimi-k2.5` (Kimi K2.5), `z-ai/glm4.7` (GLM 4.7), `deepseek-ai/deepseek-v3.2` (DeepSeek V3.2), `nvidia/llama-3.3-70b-instruct`, `deepseek/deepseek-r1`
### โช CEREBRAS (Kunci API Gratis โ inference.cerebras.ai)
| Tier | Daily Limit | Rate Limit | Notes |
| ---- | ----------------- | ---------------- | ------------------------------------------- |
| Free | **1M tokens/day** | 60K TPM / 30 RPM | World's fastest LLM inference; resets daily |
Available free: `llama-3.3-70b`, `llama-3.1-8b`, `deepseek-r1-distill-llama-70b`
### ๐ด GROQ (Kunci API Gratis โ console.groq.com)
| Tier | Daily Limit | Rate Limit | Notes |
| ---- | ------------- | ---------------- | ----------------------------------------- |
| Free | **14.4K RPD** | 30 RPM per model | No credit card; 429 on limit, not charged |
Available free: `llama-3.3-70b-versatile`, `gemma2-9b-it`, `mixtral-8x7b`, `whisper-large-v3`
### ๐ด LONGCAT AI (Kunci API Gratis โ longcat.chat) ๐
| Model | Prefix | Kuota Gratis Harian | Notes |
| ----------------------------- | ------ | ----------------- | ----------------------- |
| `LongCat-Flash-Lite` | `lc/` | **50M tokens** ๐ฅ | Kuota gratis terbesar yang pernah ada |
| `LongCat-Flash-Chat` | `lc/` | 500K tokens | Multi-turn chat |
| `LongCat-Flash-Thinking` | `lc/` | 500K tokens | Reasoning / CoT |
| `LongCat-Flash-Thinking-2601` | `lc/` | 500K tokens | Jan 2026 version |
| `LongCat-Flash-Omni-2603` | `lc/` | 500K tokens | Multimodal |
> 100% gratis saat dalam versi beta publik. Daftar di [longcat.chat](https://longcat.chat) dengan email atau telepon. Reset setiap hari pukul 00:00 UTC.
### ๐ข POLLINASI AI (Tidak Perlu Kunci API) ๐
| Model | Prefix | Rate Limit | Provider Behind |
| ---------- | ------ | ---------- | ------------------ |
| `openai` | `pol/` | 1 req/15s | GPT-5 |
| `claude` | `pol/` | 1 req/15s | Anthropic Claude |
| `gemini` | `pol/` | 1 req/15s | Google Gemini |
| `deepseek` | `pol/` | 1 req/15s | DeepSeek V3 |
| `llama` | `pol/` | 1 req/15s | Meta Llama 4 Scout |
| `mistral` | `pol/` | 1 req/15s | Mistral AI |
> โจ **Tanpa gesekan:** Tanpa pendaftaran, tanpa kunci API. Tambahkan penyedia Penyerbukan dengan bidang kunci kosong dan itu langsung berfungsi.
### ๐ AI CLOUDFLARE WORKERS (Kunci API Gratis โ cloudflare.com) ๐
| Tier | Daily Neurons | Equivalent Usage | Notes |
| ---- | ------------- | --------------------------------------- | ----------------------- |
| Free | **10,000** | ~150 LLM resp / 500s audio / 15K embeds | Keunggulan global, 50+ model |
Model gratis populer: `@cf/meta/llama-3.3-70b-instruct`, `@cf/google/gemma-3-12b-it`, `@cf/openai/whisper-large-v3-turbo` (audio gratis!), `@cf/qwen/qwen2.5-coder-15b-instruct`
> Membutuhkan Token API + ID Akun dari [dash.cloudflare.com](https://dash.cloudflare.com). Simpan ID Akun di pengaturan penyedia.
### ๐ฃ SCALEWAY AI (1 Juta Token Gratis โ scaleway.com) ๐
| Tier | Free Quota | Location | Notes |
| ---- | ------------- | ------------ | ----------------------------------- |
| Free | **1M tokens** | ๐ซ๐ท Paris, EU | No credit card needed within limits |
Tersedia gratis: `qwen3-235b-a22b-instruct-2507` (Qwen3 235B!), `llama-3.1-70b-instruct`, `mistral-small-3.2-24b-instruct-2506`, `deepseek-v3-0324`
> Sesuai dengan UE/GDPR. Dapatkan kunci API di [console.scaleway.com](https://console.scaleway.com).
> **๐ก Tumpukan Gratis Terbaik (11 Penyedia, $0 Selamanya):**
>
> ```
> Kiro (kr/) โ Claude Sonnet/Haiku TANPA BATAS
> Qoder (if/) โ kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 TANPA BATAS
> LongCat Lite (lc/) โ LongCat-Flash-Lite โ 50 juta token/hari ๐ฅ
> Pollinations (pol/) โ GPT-5, Claude, DeepSeek, Llama 4 โ tidak perlu kunci
> Qwen (qw/) โ model qwen3-coder TANPA BATAS
> Gemini (gemini/) โ Gemini 2.5 Flash โ 1.500 req/hari gratis
> Cloudflare AI (cf/) โ 50+ model โ 10 ribu Neurons/hari
> Scaleway (scw/) โ Qwen3 235B, Llama 70B โ 1 juta token gratis (EU)
> Groq (groq/) โ Llama/Gemma โ 14,4 ribu req/hari, sangat cepat
> NVIDIA NIM (nvidia/) โ 70+ model terbuka โ 40 RPM selamanya
> Cerebras (cerebras/) โ Llama/Qwen tercepat di dunia โ 1 juta tok/hari
> ```
## ๐๏ธ Kombo Transkripsi Gratis
> Transkripsikan audio/video apa pun seharga **$0** โ Deepgram memimpin dengan $200 gratis, penggantian AssemblyAI $50, Groq Whisper sebagai cadangan darurat tanpa batas.
| Provider | Free Credits | Best Model | Rate Limit |
| ----------------- | ---------------------- | -------------------------------------------- | ---------------------------- |
| ๐ข **Deepgram** | **$200 free** (signup) | `nova-3` โ best accuracy, 30+ languages | Tidak ada batasan RPM pada kredit gratis |
| ๐ต **AssemblyAI** | **$50 free** (signup) | `universal-3-pro` โ chapters, sentiment, PII | Tidak ada batasan RPM pada kredit gratis |
| ๐ด **Groq** | **Free forever** | `whisper-large-v3` โ OpenAI Whisper | 30 RPM (rate limited) |
**Suggested combo in `/dashboard/combos`:**
```
Name: free-transcription
Strategy: Priority
Nodes:
[1] deepgram/nova-3 โ uses $200 free first
[2] assemblyai/universal-3-pro โ fallback when Deepgram credits run out
[3] groq/whisper-large-v3 โ free forever, emergency fallback
```
Kemudian di tab `/dashboard/media` โ **Transkripsi**: unggah file audio atau video apa pun โ pilih titik akhir kombo Anda โ dapatkan transkripsi dalam format yang didukung.
## ๐ก Fitur Utama
OmniRoute v3.6 dibangun sebagai platform operasional, bukan hanya proxy relai.
### ๐ Baru โ Sorotan v3.6.x (Apr 2026)
| Feature | Apa Fungsinya |
| ---------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------- |
| ๐ **V1 WebSocket Bridge** | Lalu lintas WebSocket yang kompatibel dengan OpenAI ditingkatkan dan diproksi melalui `/v1/ws` โ streaming penuh melalui WS dengan autentikasi sesi (kunci API atau cookie sesi) |
| ๐ **Sync Tokens & Config Bundle** | Menerbitkan/mencabut token sinkronisasi untuk titik akhir sinkronisasi konfigurasi. Paket konfigurasi diversi dengan ETag untuk polling hemat bandwidth |
| ๐ง **GLM Thinking (glmt) Preset** | GLM Thinking registered first-class: 65 536 max tokens, 24 576 thinking budget, 900s timeout, usage sync & pricing โ Claude-compatible API |
| ๐ข **Hybrid Token Counting** | Menggunakan `/messages/count_tokens` sisi penyedia jika tersedia; kembali ke perkiraan โ pelacakan penggunaan yang akurat tanpa menebak-nebak|
|๐ฑ **Model Alias Benih Otomatis** | 30+ cross-proxy dialect aliases normalised at startup โ no more routing mismatches |
| ๐ก๏ธ **Safe Outbound Fetch** | Semua validasi penyedia dan penemuan model melalui lapisan pengambilan yang dilindungi yang memblokir URL pribadi/lokal dengan percobaan ulang, batas waktu, dan perlindungan SSRF |
| โณ **Tunggu Masa Tenang** | Percobaan ulang obrolan sisi server ketika setiap koneksi kandidat sedang dingin; dapat dikonfigurasi `enabled`, `maxRetries`, dan `maxRetryWaitSec` |
| ๐ **Validasi Env Runtime** | Startup memvalidasi semua env vars dengan skema Zod - menghapus kesalahan untuk rahasia yang hilang, URL yang tidak valid, atau tipe yang salah |
| ๐ **Compliance Audit Expansion** | Log audit terstruktur dengan penomoran halaman, konteks permintaan, peristiwa autentikasi, peristiwa CRUD penyedia, dan pencatatan validasi yang diblokir SSRF |
| ๐ **TPS Log Metric** | Modal detail log menunjukkan Token Per Second (TPS) โ sekilas kinerja cepat untuk setiap permintaan |
| ๐๏ธ **Uninstall / Full Uninstall** | `npm run uninstall` menyimpan data, `npm run uninstall:full` menghapus semuanya โ penghapusan bersih untuk semua metode instalasi |
| ๐ง **OAuth Env Repair** | Tindakan "Perbaiki env" sekali klik untuk penyedia OAuth memulihkan vars env yang hilang dan memperbaiki status autentikasi yang rusak |
| ๐ **Pematian Elektron yang Anggun** | Electron `before-quit` dimatikan Next.js dengan baik, mencegah penguncian database SQLite WAL pada penutupan desktop |
| ๐๏ธ **Pengalih Visibilitas Model** | Pengalih visibilitas per model (ikon ๐) dengan filter pencarian dan lencana jumlah aktif (`N/M active`) di halaman penyedia |
| ๐ง **Email Privacy Masking** | OAuth account emails masked (`di*****@g****.com`), full address visible on hover |
| ๐ **Context Relay Strategy** | Strategi kombo menjaga kesinambungan sesi melalui ringkasan penyerahan terstruktur saat akun dirotasi di tengah percakapan |
| ๐ก๏ธ **Proxy Hardening** | Pemeriksaan kesehatan token, validasi kunci API, dan operator undici semuanya menghormati konfigurasi proxy |
| โ ๏ธ **Node.js 24 Login Warning** | Login page proactively detects incompatible Node.js versions and shows a clear warning banner |
| ๐ **Gemini PDF Attachments** | PDF attachments correctly routed to Gemini via `inline_data` and generic base64 detection |
| ๐ **Pengerasan Keamanan CodeQL** | Resolved SSRF, insecure randomness, polynomial ReDoS, and incomplete URL sanitization alerts |
### ๐ Baru โ Peningkatan Terinspirasi ClawRouter (Mar 2026)
| Feature | Apa Fungsinya |
| ------------------------------------ | ------------------------------------------------------------------------------------------- |
| โก **Grok-4 Fast Family** | xAI models at $0.20/$0.50/M โ benchmarked 1143ms (30% faster than Gemini 2.5 Flash) |
| ๐ง **GLM-5 via Z.AI** | Konteks keluaran 128 ribu, $0,5/1 juta โ andalan terbaru dari keluarga GLM |
| ๐ฎ **MiniMax M2.5** | Penalaran + tugas agen seharga $0,30/1 juta โ peningkatan signifikan dari M2.1|
|๐ฏ **alat Memanggil Bendera per Model** | Per model `toolCalling: true/false` di registri โ AutoCombo melewatkan model yang tidak mendukung alat |
| ๐ **Multilingual Intent Detection** | Kata kunci PT/ZH/ES/AR dalam penilaian AutoCombo โ pemilihan model yang lebih baik untuk konten non-Inggris |
| ๐ **Benchmark-Driven Fallbacks** | Latensi p95 nyata dari penilaian kombo umpan permintaan langsung โ AutoCombo belajar dari data aktual |
| ๐ **Request Deduplication** | Content-hash based dedup window โ multi-agent safe, prevents duplicate charges |
| ๐ **Pluggable RouterStrategy** | Antarmuka `RouterStrategy` yang dapat diperluas โ tambahkan logika perutean khusus sebagai plugin |
### ๐ Sebelumnya v2.0.9+ โ Playground, Fingerprint CLI & ACP
| Feature | Apa Fungsinya |
| ------------------------------------------ | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| ๐ฎ **Model Playground** | Halaman dasbor untuk menguji model apa pun secara langsung โ pemilih penyedia/model/titik akhir, Editor Monaco, streaming, batalkan, pengaturan waktu |
| ๐ **CLI Fingerprint Matching** | Pengurutan header/isi per penyedia agar sesuai dengan tanda tangan CLI asli โ alihkan per penyedia di Pengaturan > Keamanan. **IP proxy Anda dipertahankan** |
| ๐ค **Dasbor Agen ACP** | Debug โบ Halaman agen โ kisi 14 agen dengan status pemasangan, versi, formulir agen khusus untuk alat CLI apa pun. Pengguna **OpenCode** mendapatkan tombol "Unduh opencode.json" yang secara otomatis menghasilkan konfigurasi siap pakai dengan semua model yang tersedia. |
| ๐ง **Custom Model `apiFormat` Routing** | Model khusus dengan `apiFormat: "responses"` sekarang dirutekan dengan benar ke penerjemah Responses API |
| ๐ข **Codex Workspace Isolation** | Multiple Codex workspaces per email โ OAuth correctly separates connections by workspace ID |
| ๐ **Pembaruan Otomatis Elektron** | Aplikasi desktop memeriksa pembaruan + instal otomatis saat restart |
### ๐ค Operasi Agen & Protokol (v2.0)
| Feature | Apa Fungsinya |
| ------------------------------------- | -------------------------------------------------------------------------------------------------------------------------------------- |
| ๐ง **Server MCP (25 alat)** | IDE/agent tools via 3 transports: stdio, SSE (`/api/mcp/sse`), Streamable HTTP (`/api/mcp/stream`). 18 core + 3 memory + 4 skill tools |
| ๐ค **Server A2A (JSON-RPC + SSE)** | Eksekusi tugas agen-ke-agen dengan alur sinkronisasi dan streaming |
| ๐งญ **Halaman Titik Akhir Konsolidasi** | Halaman manajemen bertab dengan tab Proksi Titik Akhir, MCP, A2A, dan Titik Akhir API|
| ๐๏ธ **Service Enable/Disable Toggles** |Sakelar ON/OFF untuk MCP dan A2A dengan pengaturan persistensi (default: OFF) |
| ๐ฐ๏ธ **Detak Jantung Waktu Proses MCP** | Real process status (pid, uptime, heartbeat age, transport, scope mode) |
| ๐ **MCP Audit Trail** | Log audit yang dapat difilter dengan keberhasilan/kegagalan dan atribusi kunci |
| ๐ **MCP Scope Enforcement** | 10 izin cakupan terperinci untuk akses alat terkontrol |
| ๐ก **Manajemen Siklus Hidup Tugas A2A** | List/filter tasks, inspect events/artifacts, cancel running tasks |
| ๐ **Agent Card Discovery** | `/.well-known/agent.json` untuk penemuan otomatis klien |
| ๐งช **Protocol E2E Test Harness** | Klien MCP SDK + A2A asli mengalir di `test:protocols:e2e` |
| โ๏ธ **Operational Controls** | Ganti kombo, sesuaikan pengaturan ketahanan, dan tinjau status pemutus dari permukaan Kesehatan dan Pengaturan khusus |
### ๐ง Routing & Kecerdasan
| Feature | Apa Fungsinya |
| ---------------------------------- | ------------------------------------------------------------------------ |
| ๐ฏ **Pengembalian 4 Tingkat Cerdas** | Rute otomatis: Berlangganan โ Kunci API โ Murah โ Gratis |
| ๐ **Pelacakan Kuota Waktu Nyata** | Jumlah token langsung + setel ulang hitungan mundur per penyedia |
| ๐ **Format Translation** | OpenAI โ Claude โ Gemini โ Respons dengan konversi skema-aman |
| ๐ฅ **Dukungan Multi-Akun** | Banyak akun per penyedia dengan pilihan cerdas |
| ๐ **Auto Token Refresh** | Token OAuth disegarkan secara otomatis dengan percobaan ulang |
| ๐จ **Custom Combos** | 13 strategi penyeimbangan + kontrol rantai mundur |
| ๐ **Context Relay** | Penyerahan kesinambungan sesi ketika rotasi akun terjadi di tengah sesi |
| ๐ **Wildcard Router** | `provider/*` dynamic routing |
| ๐ง **Thinking Budget Controls** | Batas penalaran passthrough, otomatis, kustom, dan adaptif|
| ๐ **Model Aliases** |Alias โโmodel khusus + bawaan dan keamanan migrasi |
| โก **Background Degradation** | Arahkan tugas latar belakang berprioritas rendah ke model yang lebih murah |
| ๐งช **Perutean Cerdas Sadar Tugas** | Pilih model secara otomatis berdasarkan jenis konten (pengkodean/visi/analisis/ringkasan) |
| ๐ **A2A Agent Workflows** | Deterministic FSM orchestrator for stateful multi-step agent executions |
| ๐ **Adaptive Routing** | Dynamic strategy override based on token volume and prompt complexity |
| ๐ฒ **Provider Diversity** | Shannon entropy scoring balancing auto-combo traffic distribution |
| ๐ฌ **System Prompt Injection** | Global behavior controls applied consistently |
| ๐ **Kompatibilitas API Respons** | Dukungan penuh `/v1/responses` untuk Codex dan alur kerja agen tingkat lanjut |
### ๐ต API Multi-Modal
| Feature | Apa Fungsinya |
| -------------------------- | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| ๐ผ๏ธ **Image Generation** | `/v1/images/generations` dengan cloud dan backend lokal |
| ๐ **Embeddings** | `/v1/embeddings` untuk saluran pencarian dan RAG |
| ๐ค **Audio Transcription** | `/v1/audio/transcriptions` โ 7 providers (Deepgram Nova 3, AssemblyAI, Groq Whisper, HuggingFace, ElevenLabs, OpenAI, Azure), auto-language detection, MP4/MP3/WAV support |
| ๐ **Text-to-Speech** | `/v1/audio/speech` โ 10 penyedia (ElevenLabs, OpenAI, Deepgram, Cartesia, PlayHT, HuggingFace, Nvidia NIM, Inworld, Coqui, Tortoise) dengan pesan kesalahan yang benar |
| ๐ฌ **Video Generation** | `/v1/videos/generations` (ComfyUI + SD WebUI workflows) |
| ๐ต **Music Generation** | `/v1/music/generations` (ComfyUI workflows) |
| ๐ก๏ธ **Moderations** | `/v1/moderations` safety checks |
| ๐ **Reranking** | `/v1/rerank` untuk penilaian relevansi |
| ๐ **Web Search** ๐ | `/v1/search` โ 5 providers (Serper, Brave, Perplexity, Exa, Tavily), 6,500+ free/month, auto-failover, cache |
### ๐ก๏ธ Ketahanan, Keamanan & Tata Kelola
| Feature | Apa Fungsinya |
| ----------------------------------- | ------------------------------------------------------------------------------------------------------- |
| ๐ **Penyedia Pemutus Arus** | Perjalanan/pemulihan di seluruh penyedia setelah kelelahan fallback dengan ambang batas yang dapat dikonfigurasi |
| ๐ **Kunci Kuota Harian** ๐ | Mendeteksi sinyal kelelahan dan mengunci perutean untuk model tertentu hingga tengah malam |
| ๐ฏ **Model Sadar Titik Akhir** | Model khusus mendeklarasikan titik akhir + format API yang didukung |
| ๐ก๏ธ **Anti-Thundering Herd** | Mutex + semaphore protections on retry/rate events |
| ๐ง **Semantic + Signature Cache** | Pengurangan biaya/latensi dengan dua lapisan cache |
| โก **Request Idempotency** | Duplicate protection window |
| ๐ **TLS Fingerprint Spoofing** | Sidik jari TLS seperti browser โ **mengurangi deteksi bot dan penandaan akun**|
| ๐ **CLI Fingerprint Matching** | Matches native CLI request signatures โ **reduces ban risk while preserving proxy IP** |
| ๐ **IP Filtering** |Kontrol daftar yang diizinkan/daftar blokir untuk penerapan yang terbuka |
| ๐ฆ **Minta Antrian & Kecepatan** | Bucket permintaan per koneksi yang dapat dikonfigurasi untuk RPM, spasi, konkurensi, dan waktu tunggu maksimal |
| ๐ **Graceful Degradation** | Multi-layer capability fallbacks protecting core gateway operations |
| ๐ **Config Audit Trail** | Pelacakan perubahan berbasis diff mencegah penyimpangan operasional dengan rollback sederhana |
| โณ **Sinkronisasi Kesehatan Penyedia** | Proactive token expiration monitoring triggering alerts before authorization failures |
| โ๏ธ **Connection Cooldown** | Retryable 408/429/5xx failures cool down a single connection with optional upstream hints |
| ๐ช **Nonaktifkan Otomatis Akun yang Diblokir** | Akun token yang diblokir secara permanen dapat dinonaktifkan secara otomatis |
| ๐ **Manajemen Kunci API + Pelingkupan** | Mengamankan penerbitan/rotasi kunci dan kontrol model/penyedia |
| ๐๏ธ **Pengungkapan Kunci API Cakupan** ๐ | Ikut serta dalam pemulihan kunci API melalui `ALLOW_API_KEY_REVEAL` |
| ๐ก๏ธ **Protected `/models`** | Gerbang autentikasi opsional dan penyembunyian penyedia untuk katalog model |
| ๐ก๏ธ **Safe Outbound Fetch** ๐ | Pengambilan yang dijaga untuk panggilan penyedia โ memblokir URL pribadi/lokal, percobaan ulang, perlindungan SSRF |
| โณ **Tunggu Cooldown** ๐ | Coba ulang obrolan secara otomatis setelah cooldown koneksi; dapat dikonfigurasi `enabled`, `maxRetries`, dan `maxRetryWaitSec` |
| ๐ **Validasi Env Runtime** ๐ | Zod-based env schema validation at startup with actionable error messages |
| ๐ **Compliance Audit v2** ๐ | Penomoran halaman, konteks permintaan, peristiwa autentikasi, CRUD penyedia, dan logging yang diblokir SSRF |
### ๐ Observabilitas & Analitik
| Feature | Apa Fungsinya |
| -------------------------------- | ----------------------------------------------------- |
| ๐ **Permintaan + Pencatatan Proksi** | Permintaan/respons penuh dan pencatatan proksi|
| ๐ **Streamed Detailed Logs** |Merekonstruksi aliran muatan SSE dengan rapi ke dalam UI |
| ๐ท๏ธ **Lencana Model Real-Time** ๐ | Status model langsung dan penghitung waktu mundur kuota harian |
| ๐ **Dasbor Log Terpadu** | Tampilan permintaan, proksi, audit, dan konsol dalam satu halaman |
| ๐ **Request Telemetry** | latensi p50/p95/p99 dan penelusuran permintaan |
| ๐ฅ **Health Dashboard** | Uptime, breaker states, lockouts, cache stats |
| ๐ฐ **Cost Tracking** | Kontrol anggaran dan visibilitas harga per model |
| ๐ **Analytics Visualizations** | Wawasan penggunaan model/penyedia dan tampilan tren |
| ๐งช **Evaluation Framework** | Pengujian set emas dengan strategi pencocokan yang dapat dikonfigurasi |
| ๐ก **Live Diagnostics** ๐ | Bypass cache semantik untuk pengujian langsung kombo yang akurat |
| ๐ **TPS Log Metric** ๐ | Tokens Per Second badge in log details modal |
### โ๏ธ Deployment & Platform
| Feature | Apa Fungsinya |
| ------------------------------ | --------------------------------------------------------------------- |
| ๐ **Deploy Anywhere** | Localhost, VPS, Docker, Cloud environments |
| ๐ **Cloudflare Tunnel** ๐ | Integrasi Quick Tunnel sekali klik dari dasbor |
| ๐ **Pemfilteran Model Kunci API** | Respons asli /v1/models difilter melalui peran konteks Pembawa yang ditetapkan |
| โก **Smart Cache Bypass** | Heuristik TTL yang dapat dikonfigurasi dan kontrol pengambilan ulang paksa |
| ๐ **Backup/Restore** | Arus ekspor/impor dan pemulihan bencana |
| ๐ง **Onboarding Wizard** | Penyiapan terpandu yang dijalankan pertama kali |
| ๐ง **Dasbor Alat CLI** | Pengaturan sekali klik untuk alat pengkodean populer |
| ๐ฎ **Model Playground** | Uji penyedia/model/titik akhir apa pun dari dasbor|
| ๐ **CLI Fingerprint Toggle** |Pencocokan sidik jari per penyedia di Pengaturan > Keamanan |
| ๐ **i18n (30 languages)** | Dasbor lengkap + dukungan bahasa dokumen dengan cakupan RTL |
| ๐งน **Hapus Semua Model** | Pembersihan daftar model sekali klik di detail penyedia |
| ๐๏ธ **Sidebar Controls** ๐ | Sembunyikan komponen dan integrasi dari Pengaturan Penampilan |
| ๐ **Issue Templates** | Templat GitHub standar untuk bug dan fitur |
| ๐ **Custom Data Directory** | `DATA_DIR` penggantian untuk lokasi penyimpanan |
| ๐ **V1 WebSocket Bridge** ๐ | OpenAI-compatible WebSocket traffic proxied via `/v1/ws` |
| ๐ **Sync Tokens & Bundle** ๐ | Konfigurasikan token sinkronisasi + titik akhir bundel berversi dengan dukungan ETag |
### Fitur Penyelaman Mendalam
#### Penggantian cerdas dengan pengendalian biaya praktis
```txt
Combo: "my-coding-stack"
1. cc/claude-opus-4-7
2. nvidia/llama-3.3-70b
3. glm/glm-4.7
4. if/kimi-k2-thinking
```
Ketika kuota, tarif, atau kesehatan gagal, OmniRoute secara otomatis berpindah ke kandidat berikutnya tanpa peralihan manual.
#### Manajemen protokol yang terlihat dan dapat dioperasikan
- MCP + A2A dapat ditemukan di UI dan dokumen (tidak disembunyikan)
- API status protokol memaparkan data operasional langsung (`/api/mcp/*`, `/api/a2a/*`)
- Dasbor mencakup tindakan untuk operasi hari ke-2 (pengalihan kombo, pengaturan ulang pemutus, pembatalan tugas)
#### Workflow translator + validasi
Area Penerjemah meliputi:
- **Playground**: request transformation checks
- **Chat Tester**: full request/response round-trip
- **Test Bench**: multiple cases in one run
- **Live Monitor**: real-time traffic view
Ditambah validasi protokol dengan klien nyata melalui `npm run test:protocols:e2e`.
> ๐ **[MCP Server README](open-sse/mcp-server/README.md)** โ Referensi alat, konfigurasi IDE, dan contoh klien
>
> ๐ **[A2A Server README](src/lib/a2a/README.md)** โ Keterampilan, metode JSON-RPC, streaming, dan siklus hidup tugas
## ๐งช Evaluasi (Evals)
OmniRoute menyertakan kerangka evaluasi bawaan untuk menguji kualitas respons LLM terhadap rangkaian emas. Akses melalui **Analytics โ Evals** di dasbor.
### Golden Set Bawaan
"OmniRoute Golden Set" yang dimuat sebelumnya berisi kasus uji untuk:
- Salam, matematika, geografi, pembuatan kode
- Kepatuhan format JSON, terjemahan, pembuatan penurunan harga
- Penolakan keamanan (konten berbahaya), penghitungan, logika boolean
### Strategi Evaluasi
| Strategy | Description | Example |
| ---------- | ------------------------------------------------ | -------------------------------- |
| `exact` | Output must match exactly | `"4"` |
| `contains` | Output must contain substring (case-insensitive) | `"Paris"` |
| `regex` | Output must match regex pattern | `"1.*2.*3"` |
| `custom` | Custom JS function returns true/false | `(output) => output.length > 10` |
---
## ๐ Panduan Setup
### Pengaturan Protokol (MCP + A2A)
๐งฉ Penyiapan MCP (Protokol Konteks Model)
Start MCP transport in stdio mode:
```bash
omniroute --mcp
```
Recommended validation flow:
1. Hubungkan klien MCP Anda melalui stdio.
2. Jalankan `omniroute_get_health`.
3. Jalankan `omniroute_list_combos`.
4. Buka `/dashboard/mcp` untuk mengonfirmasi detak jantung, aktivitas, dan audit.
API yang berguna untuk otomatisasi:
- `GET /api/mcp/status`
- `GET /api/mcp/tools`
- `GET /api/mcp/audit`
- `GET /api/mcp/audit/stats`
๐ค Pengaturan A2A (Agen2Agen)
Temukan agennya:
```bash
curl http://localhost:20128/.well-known/agent.json
```
Send a task:
```bash
curl -X POST http://localhost:20128/a2a \
-H 'content-type: application/json' \
-d '{"jsonrpc":"2.0","id":"setup-a2a","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Summarize quota status."}]}}'
```
Manage lifecycle:
- `GET /api/a2a/status`
- `GET /api/a2a/tasks`
- `GET /api/a2a/tasks/:id`
- `POST /api/a2a/tasks/:id/cancel`
Operational UI:
- `/dashboard/a2a` untuk observasi tugas/status/aliran dan tindakan asap
๐งช Validasi protokol end-to-end
Validasi kedua protokol dengan klien nyata:
```bash
npm run test:protocols:e2e
```
This verifies:
- Koneksi/daftar/panggilan klien MCP SDK
- Penemuan A2A/kirim/aliran/dapatkan/batalkan
- Periksa silang data dalam audit MCP dan API manajemen tugas A2A
๐ณ Penyedia Berlangganan
### Claude Code (Pro/Max)
```bash
Dashboard โ Providers โ Connect Claude Code
โ OAuth login โ Auto token refresh
โ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-7
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001
```
**Kiat Pro:** Gunakan Opus untuk tugas kompleks, Soneta untuk kecepatan. OmniRoute melacak kuota per model!
### OpenAI Codex (Plus/Pro)
```bash
Dashboard โ Providers โ Connect Codex
โ OAuth login (port 1455)
โ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-max
```
#### Manajemen Batas Akun Codex (5 jam + Mingguan)
Setiap akun Codex kini memiliki kebijakan yang dapat diubah di `Dashboard -> Providers`:
- `5h` (ON/OFF): menerapkan kebijakan ambang jendela 5 jam.
- `Weekly` (ON/OFF): menerapkan kebijakan ambang jendela mingguan.
- Perilaku ambang batas: ketika jendela yang diaktifkan mencapai >=90% penggunaan, akun tersebut dilewati.
- Perilaku rotasi: OmniRoute merutekan ke akun Codex berikutnya yang memenuhi syarat secara otomatis.
- Perilaku reset: ketika waktu `resetAt` penyedia telah berlalu, akun akan memenuhi syarat lagi secara otomatis.
Scenarios:
- `5h ON` + `Weekly ON`: akun dilewati ketika salah satu jendela mencapai ambang batas.
- `5h OFF` + `Weekly ON`: hanya penggunaan mingguan yang dapat memblokir akun.
- `5h ON` + `Weekly OFF` : hanya penggunaan 5 jam yang dapat memblokir akun.
- `resetAt` lolos: akun masuk kembali ke rotasi secara otomatis (tidak ada pengaktifan ulang secara manual).
### GitHub Copilot
```bash
Dashboard โ Providers โ Connect GitHub
โ OAuth via GitHub
โ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3.1-pro-preview
```
๐ Penyedia Kunci API
### NVIDIA NIM (akses pengembang GRATIS โ 70+ model)
1. Daftar: [build.nvidia.com](https://build.nvidia.com)
2. Dapatkan kunci API gratis (termasuk 1000 kredit inferensi)
3. Dasbor โ Tambah Penyedia โ NVIDIA NIM:
- Kunci API: `nvapi-your-key`
**Model:** `nvidia/llama-3.3-70b-instruct`, `nvidia/mistral-7b-instruct`, dan 50+ lainnya
**Kiat Pro:** API yang kompatibel dengan OpenAI โ bekerja secara lancar dengan terjemahan format OmniRoute!
### DeepSeek
1. Daftar: [platform.deepseek.com](https://platform.deepseek.com)
2. Dapatkan kunci API
3. Dasbor โ Tambah Penyedia โ DeepSeek
**Models:** `deepseek/deepseek-chat`, `deepseek/deepseek-coder`
### Groq (Tersedia Tingkat Gratis!)
1. Daftar: [console.groq.com](https://console.groq.com)
2. Dapatkan kunci API (termasuk tingkat gratis)
3. Dasbor โ Tambah Penyedia โ Groq
**Models:** `groq/llama-3.3-70b`, `groq/mixtral-8x7b`
**Pro Tip:** Ultra-fast inference โ best for real-time coding!
### OpenRouter (100+ Model)
1. Daftar: [openrouter.ai](https://openrouter.ai)
2. Dapatkan kunci API
3. Dasbor โ Tambah Penyedia โ OpenRouter
**Model:** Akses 100+ model dari semua penyedia utama melalui satu kunci API.
**Perilaku dasbor:** Model OpenRouter dikelola dari **Model yang Tersedia**. Penambahan manual, impor, dan sinkronisasi otomatis semuanya memperbarui daftar yang sama.
๐ฐ Penyedia Murah (Cadangan)
### GLM-4.7 (Reset harian, $0.6/1M)
1. Daftar: [Zhipu AI](https://open.bigmodel.cn/)
2. Dapatkan kunci API dari Coding Plan
3. Dasbor โ Tambahkan Kunci API:
- Penyedia: `glm`
- Kunci API: `your-key`
**Use:** `glm/glm-4.7`
**Tips Pro:** Paket Coding menawarkan 3ร kuota dengan biaya 1/7! Reset setiap hari pukul 10.00.
### MiniMax M2.1 (Reset 5 jam, $0.20/1M)
1. Daftar: [MiniMax](https://www.minimax.io/)
2. Dapatkan kunci API
3. Dasbor โ Tambahkan Kunci API
**Use:** `minimax/MiniMax-M2.1`
**Kiat Pro:** Opsi termurah untuk konteks panjang (1 juta token)!
### Kimi K2 ($9/bulan flat)
1. Berlangganan: [Moonshot AI](https://platform.moonshot.ai/)
2. Dapatkan kunci API
3. Dasbor โ Tambahkan Kunci API
**Use:** `kimi/kimi-latest`
**Kiat Pro:** Memperbaiki $9/bulan untuk 10 juta token = biaya efektif $0,90/1 juta!
๐ Penyedia GRATIS (Cadangan Darurat)
### Qoder (5 model GRATIS melalui OAuth)
```bash
Dashboard โ Connect Qoder
โ Qoder OAuth login
โ Unlimited usage
Models:
if/kimi-k2-thinking
if/qwen3-coder-plus
if/glm-4.7
if/minimax-m2
if/deepseek-r1
```
### Qwen (4 model GRATIS melalui Kode Perangkat)
```bash
Dashboard โ Connect Qwen
โ Device code authorization
โ Unlimited usage
Models:
qw/qwen3-coder-plus
qw/qwen3-coder-flash
```
### Kiro (Claude GRATIS)
```bash
Dashboard โ Connect Kiro
โ AWS Builder ID or Google/GitHub
โ Unlimited usage
Models:
kr/claude-sonnet-4.5
kr/claude-haiku-4.5
```
๐จ Membuat Combo
### Contoh 1: Maksimalkan Langganan โ Cadangan Murah
```
Dashboard โ Combos โ Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-7 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-coding
```
### Contoh 2: Gratis Saja (Tanpa Biaya)
```
Name: free-combo
Models:
1. if/kimi-k2-thinking (unlimited)
2. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!
```
๐ง Integrasi CLI
### Cursor IDE
```
Settings โ Models โ Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from OmniRoute dashboard]
Model: cc/claude-opus-4-7
```
### Claude Code
Gunakan halaman **Alat CLI** di dasbor untuk konfigurasi sekali klik, atau edit `~/.claude/settings.json` secara manual.
### Codex CLI
```bash
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"
```
### OpenClaw
**Opsi 1 โ Dasbor (disarankan):**
```
Dashboard โ CLI Tools โ OpenClaw โ Select Model โ Apply
```
**Option 2 โ Manual:** Edit `~/.openclaw/openclaw.json`:
```json
{
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://127.0.0.1:20128/v1",
"apiKey": "sk_omniroute",
"api": "openai-completions"
}
}
}
}
```
> **Catatan:** OpenClaw hanya berfungsi dengan OmniRoute lokal. Gunakan `127.0.0.1` alih-alih `localhost` untuk menghindari masalah resolusi IPv6.
### Cline / Continue / RooCode
```
Settings โ API Configuration:
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from OmniRoute dashboard]
Model: if/kimi-k2-thinking
```
### OpenCode
**Langkah 1:** Tambahkan OmniRoute sebagai penyedia khusus:
```bash
opencode
/connect
# Select "Other" โ Enter ID: "omniroute" โ Enter your OmniRoute API key
```
**Langkah 2:** Buat/edit `opencode.json` di root proyek Anda:
```json
{
"$schema": "https://opencode.ai/config.json",
"provider": {
"omniroute": {
"npm": "@ai-sdk/openai-compatible",
"name": "OmniRoute",
"options": {
"baseURL": "http://localhost:20128/v1"
},
"models": {
"cc/claude-sonnet-4-20250514": { "name": "Claude Sonnet 4" },
"gg/gemini-2.5-pro": { "name": "Gemini 2.5 Pro" },
"if/kimi-k2-thinking": { "name": "Kimi K2 (Free)" }
}
}
}
}
```
**Langkah 3:** Pilih model di OpenCode:
```bash
/models
# Select any OmniRoute model from the list
```
> **Tips:** Tambahkan model apa pun yang tersedia di titik akhir OmniRoute `/v1/models` Anda ke bagian `models`. Gunakan format `provider/model-id` dari dasbor OmniRoute Anda.
---
## Pemecahan Masalah
Klik untuk memperluas panduan pemecahan masalah
**"Model bahasa tidak memberikan pesan"**
- Kuota penyedia habis โ Periksa dashboard pelacak kuota
- Solusi: Gunakan combo fallback atau beralih ke tier yang lebih murah
**Rate limiting**
- Kuota berlangganan habis โ Penggantian ke GLM/MiniMax
- Tambahkan kombo: `cc/claude-opus-4-7 โ glm/glm-4.7 โ if/kimi-k2-thinking`
**OAuth token expired**
- Disegarkan secara otomatis oleh OmniRoute
- Jika masalah terus berlanjut: Dasbor โ Penyedia โ Sambungkan kembali
**High costs**
- Periksa statistik penggunaan di Dashboard โ Biaya
- Ganti model utama ke GLM/MiniMax
**Port dasbor/API salah**
- `PORT` adalah port dasar kanonik (dan port API secara default)
- `API_PORT` hanya menimpa pendengar API yang kompatibel dengan OpenAI
- `DASHBOARD_PORT` hanya menimpa dashboard/pendengar Next.js
- Setel `NEXT_PUBLIC_BASE_URL` ke dasbor/URL publik Anda (untuk panggilan balik OAuth)
**Cloud sync errors**
- Verifikasi `BASE_URL` poin ke instance Anda yang sedang berjalan
- Verifikasi `CLOUD_URL` poin ke titik akhir cloud yang Anda harapkan
- Jaga agar nilai `NEXT_PUBLIC_*` selaras dengan nilai sisi server
**First login not working**
- Periksa `INITIAL_PASSWORD` di `.env`
- Jika tidak disetel, kata sandi cadangan adalah `123456`
**Tidak ada log permintaan**
- `call_logs` di SQLite menyimpan metadata ringkasan untuk tabel Log Permintaan dan tampilan analitik
- Muatan permintaan/respons terperinci ditulis ke `DATA_DIR/call_logs/` sebagai satu artefak JSON per permintaan
- Aktifkan pengambilan saluran pipa dari Dasbor โ Log โ Log Permintaan jika Anda memerlukan muatan per tahap yang terperinci
- `Export Logs` membaca file artefak sesuai permintaan, sementara `Export All` menyertakan direktori `call_logs/` bersama `storage.sqlite`
- Setel `APP_LOG_TO_FILE=true` jika Anda juga ingin log konsol aplikasi di `logs/application/app.log`
- Sesuaikan `APP_LOG_MAX_FILE_SIZE`, `APP_LOG_RETENTION_DAYS`, `APP_LOG_MAX_FILES`, dan `CALL_LOG_MAX_ENTRIES` sesuai kebutuhan
**Tes koneksi menunjukkan "Tidak Valid" untuk penyedia yang kompatibel dengan OpenAI**
- Banyak penyedia tidak mengekspos titik akhir `/models`
- OmniRoute v1.0.6+ menyertakan validasi fallback melalui penyelesaian obrolan
- Pastikan URL dasar menyertakan akhiran `/v1`
### ๐ OAuth di Server Jarak Jauh
> **โ ๏ธ Penting bagi pengguna yang menjalankan OmniRoute di VPS, Docker, atau server jarak jauh mana pun**
Kredensial OAuth yang disertakan dalam OmniRoute didaftarkan **hanya untuk `localhost`**. Saat Anda mengakses OmniRoute di server jarak jauh (misalnya `https://omniroute.myserver.com`), Google menolak autentikasi dengan:
```
Error 400: redirect_uri_mismatch
```
#### Solusi: Konfigurasikan kredensial OAuth Anda sendiri
Anda perlu membuat **ID Klien OAuth 2.0** di Google Cloud Console dengan URI server Anda.
#### Langkah demi langkah
**1. Open Google Cloud Console**
Go to: [https://console.cloud.google.com/apis/credentials](https://console.cloud.google.com/apis/credentials)
**2. Buat ID Klien OAuth 2.0 baru**
- Klik **"+ Buat Kredensial"** โ **"ID klien OAuth"**
- Jenis aplikasi: **"Aplikasi web"**
- Nama: apa pun yang Anda suka (mis. `OmniRoute Remote`)
**3. Add Authorized Redirect URIs**
Di kolom **"URI pengalihan resmi"**, tambahkan:
```
https://your-server.com/callback
```
> Ganti `your-server.com` dengan domain atau IP server Anda (sertakan port jika diperlukan, misalnya `http://45.33.32.156:20128/callback`).
**4. Simpan dan salin kredensial**
Setelah pembuatan, Google akan menampilkan **ID Klien** dan **Rahasia Klien**.
**5. Tetapkan variabel lingkungan**
Di `.env` Anda (atau variabel lingkungan Docker):
```bash
# For Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-your-secret
GEMINI_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-your-secret
```
**6. Restart OmniRoute**
```bash
# npm:
npm run dev
# Docker:
docker restart omniroute
```
**7. Try connecting again**
Google will now redirect correctly to `https://your-server.com/callback`.
---
#### Solusi sementara (tanpa kredensial kustom)
Jika Anda tidak ingin menyiapkan kredensial Anda sendiri saat ini, Anda masih dapat menggunakan **alur URL manual**:
1. OmniRoute membuka URL otorisasi Google
2. Setelah otorisasi, Google mencoba mengalihkan ke `localhost` (yang gagal di server jauh)
3. **Salin URL lengkap** dari bilah alamat browser Anda (meskipun halaman tidak dimuat)
4. Tempelkan URL tersebut ke bidang yang ditampilkan di modal koneksi OmniRoute
5. Klik **"Hubungkan"**
> Ini berfungsi karena kode otorisasi di URL valid terlepas dari apakah halaman pengalihan dimuat.
---
๐ง๐ท Versรฃo em Portuguรชs
As credenciais OAuth embutidas no OmniRoute estรฃo cadastradas **apenas para `localhost`**. Quando vocรช acessa o OmniRoute em um servidor remoto (ex: `https://omniroute.meuservidor.com`), o Google rejeita a autenticaรงรฃo com:
```
Error 400: redirect_uri_mismatch
```
#### Soluรงรฃo: Configure suas prรณprias credenciais OAuth
Vocรช precisa criar um **OAuth 2.0 Client ID** no Google Cloud Console com a URI do seu servidor.
#### Passo a passo
**1. Acesse o Google Cloud Console**
Abra: [https://console.cloud.google.com/apis/credentials](https://console.cloud.google.com/apis/credentials)
**2. Inilah ID Klien OAuth 2.0 yang baru**
- Klik pada **"+ Buat Kredensial"** โ **"ID klien OAuth"**
- Tip aplikasi: **"Aplikasi web"**
- Nama: nama escolha qualquer (misal: `OmniRoute Remote`)
**3. Adicione as Authorized Redirect URIs**
No campo **"Authorized redirect URIs"**, adicione:
```
https://seu-servidor.com/callback
```
> Substitua `seu-servidor.com` pelo domรญnio ou IP do seu servidor (inclua a porta se necessรกrio, ex: `http://45.33.32.156:20128/callback`).
**4. Salve e copie as credenciais**
Kemudian, Google menampilkan **ID Klien** dan **Rahasia Klien**.
**5. Configure as variรกveis de ambiente**
No seu `.env` (ou nas variรกveis de ambiente do Docker):
```bash
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
```
**6. Reinicie o OmniRoute**
```bash
# Se usando npm:
npm run dev
# Se usando Docker:
docker restart omniroute
```
**7. Tente conectar novamente**
Agora o Google redirecionarรก corretamente para `https://seu-servidor.com/callback` e a autenticaรงรฃo funcionarรก.
---
#### Workaround temporรกrio (sem configurar credenciais prรณprias)
Se nรฃo quiser criar credenciais prรณprias agora, ainda รฉ possรญvel usar o fluxo **manual de URL**:
1. O OmniRoute abrirรก a URL de autorizaรงรฃo do Google
2. Apรณs vocรช autorizar, o Google tentarรก redirecionar para `localhost` (que falha no servidor remoto)
3. **Copie a URL completa** da barra de endereรงo do seu browser (mesmo que a pรกgina nรฃo carregue)
4. Cole essa URL no campo que aparece no modal de conexรฃo do OmniRoute
5. Clique em **"Connect"**
> Este workaround funciona porque o cรณdigo de autorizaรงรฃo na URL รฉ vรกlido independente do redirect ter carregado ou nรฃo.
---
## ๐ ๏ธ Stack Teknologi
Klik untuk membuka detail stack teknologi
- **Runtime**: Node.js 18โ22 LTS (โ ๏ธ Node.js 24+ **tidak didukung** โ `better-sqlite3` biner asli tidak kompatibel)
- **Bahasa**: TypeScript 5.9 โ **100% TypeScript** di `src/` dan `open-sse/` (nol `any` dalam modul inti sejak v2.0)
- **Kerangka Kerja**: Next.js 16 + React 19 + Tailwind CSS 4
- **Database**: lebih baik-sqlite3 (SQLite) + LowDB (JSON legacy) โ status domain, log proksi, audit MCP, keputusan perutean, memori, keterampilan
- **Skema**: Zod (validasi I/O alat MCP, kontrak API)
- **Protokol**: MCP (stdio/HTTP) + A2A v0.3 (JSON-RPC 2.0 + SSE)
- **Streaming**: Peristiwa Terkirim Server (SSE)
- **Auth**: OAuth 2.0 (PKCE) + JWT + Kunci API + Otorisasi Cakupan MCP
- **Pengujian**: Pelari pengujian Node.js + Vitest (900+ pengujian termasuk unit, integrasi, E2E)
- **CI/CD**: Tindakan GitHub (publikasi npm otomatis + Docker Hub saat dirilis)
- **Situs Web**: [omniroute.online](https://omniroute.online)
- **Paket**: [npmjs.com/package/omniroute](https://www.npmjs.com/package/omniroute)
- **Pekerja Pelabuhan**: [hub.docker.com/r/diegosouzapw/omniroute](https://hub.docker.com/r/diegosouzapw/omniroute)
- **Ketahanan**: Pemutus arus, backoff eksponensial, kawanan anti-thundering, spoofing TLS, penyembuhan diri kombo otomatis
---
## Dokumentasi
| Document | Description |
| --------------------------------------------------------------------- | --------------------------------------------------- |
| [User Guide](docs/guides/USER_GUIDE.md) | Penyedia, kombo, integrasi CLI, penerapan |
| [API Reference](docs/reference/API_REFERENCE.md) | Semua titik akhir dengan contoh |
| [MCP Server](open-sse/mcp-server/README.md) | 25 alat MCP, konfigurasi IDE, klien Python/TS/Go |
| [A2A Server](src/lib/a2a/README.md) | Protokol JSON-RPC 2.0, keterampilan, streaming, manajemen tugas |
| [Auto-Combo Engine](docs/routing/AUTO-COMBO.md) | 6-factor scoring, mode packs, self-healing |
| [Context Relay](docs/features/context-relay.md) | Strategi penyerahan sesi untuk rotasi akun |
| [Troubleshooting](docs/guides/TROUBLESHOOTING.md) | Masalah umum dan solusinya |
| [Architecture](docs/architecture/ARCHITECTURE.md) | Arsitektur sistem dan internal|
| [Codebase Documentation](docs/architecture/CODEBASE_DOCUMENTATION.md) | Beginner-friendly codebase walkthrough |
| [Uninstall Guide](docs/guides/UNINSTALL.md) |Penghapusan bersih untuk semua metode instalasi |
| [Environment Config](docs/reference/ENVIRONMENT.md) | Lengkapi `.env` variabel dan referensi |
| [Contributing](CONTRIBUTING.md) | Pengaturan dan pedoman pengembangan |
| [OpenAPI Spec](docs/reference/openapi.yaml) | OpenAPI 3.0 specification |
| [Security Policy](SECURITY.md) | Pelaporan kerentanan dan praktik keamanan |
| [VM Deployment](docs/ops/VM_DEPLOYMENT_GUIDE.md) | Panduan lengkap: pengaturan VM + nginx + Cloudflare |
| [Features Gallery](docs/guides/FEATURES.md) | Tur dasbor visual dengan tangkapan layar |
| [Release Checklist](docs/ops/RELEASE_CHECKLIST.md) | Pre-release validation steps |
---
## ๐บ๏ธ Roadmap
OmniRoute memiliki **218+ fitur yang direncanakan** di berbagai fase pengembangan. Berikut adalah bidang-bidang utamanya:
| Category | Planned Features | Highlights |
| ----------------------------- | ---------------- | ----------------------------------------------------------------------------------------------------- |
| ๐ง **Routing & Intelligence** | 25+ | Perutean latensi terendah, perutean berbasis tag, preflight kuota, P2C sadar kuota, perutean kombo berbasis langkah |
| ๐ **Security & Compliance** | 20+ | Pengerasan SSRF, penyelubungan kredensial, batas tarif per titik akhir, pelingkupan kunci manajemen |
| ๐ **Observability** | 15+ | Integrasi OpenTelemetry, pemantauan kuota waktu nyata, kesehatan target kombo, pelacakan biaya per model |
| ๐ **Provider Integrations** | 20+ | Registri model dinamis, cooldown koneksi, Codex multi-akun, penguraian kuota Salinan |
| โก **Performance** | 15+ | Lapisan cache ganda, cache cepat, cache respons, streaming keepalive, API batch|
| ๐ **Ecosystem** | 10+ | WebSocket API, config hot-reload, distributed config store, commercial mode |
### ๐ Segera Hadir
- ๐ **Integrasi OpenCode** โ Dukungan penyedia asli untuk IDE pengkodean AI OpenCode
- ๐ **Integrasi TRAE** โ Dukungan penuh untuk kerangka pengembangan AI TRAE
- ๐ฆ **Batch API** โ Pemrosesan batch asinkron untuk permintaan massal
- ๐ฏ **Perutean Berbasis Tag** โ Merutekan permintaan berdasarkan tag dan metadata khusus
- ๐ฐ **Strategi Biaya Terendah** โ Secara otomatis memilih penyedia termurah yang tersedia
> ๐ Spesifikasi fitur lengkap tersedia di [docs/new-features/](docs/new-features/) (217 spesifikasi detail)
---
## ๐ฅ Kontributor
[](https://github.com/diegosouzapw/OmniRoute/graphs/contributors)
### Cara Berkontribusi
1. Cabangkan repositori
2. Buat cabang fitur Anda (`git checkout -b feature/amazing-feature`)
3. Komit perubahan Anda (`git commit -m 'Add amazing feature'`)
4. Dorong ke cabang (`git push origin feature/amazing-feature`)
5. Buka Permintaan Tarik
Lihat [CONTRIBUTING.md](CONTRIBUTING.md) untuk panduan detailnya.
### Merilis Versi Baru
```bash
# Create a release โ npm publish happens automatically
gh release create v2.0.0 --title "v2.0.0" --generate-notes
```
---
## ๐ Riwayat Star
## ๐ StarMapper
## ๐ Ucapan Terima Kasih
Terima kasih khusus kepada **[CLIProxyAPI](https://github.com/router-for-me/CLIProxyAPI)** โ implementasi Go asli yang menginspirasi port JavaScript ini.
---
## Lisensi
Lisensi MIT - lihat [LICENSE](LICENSE) untuk detailnya.
---