Satu Endpoint, Semua Model

Gateway Naraya untuk semua model.

LIVE

DeepSeek 4 Flash

128K context · cepat

Versi ringan super cepat. Ideal untuk CS bot, WhatsApp agent, dan task volume tinggi.

Rp 2.5K/ 1M token inFREE TIER ✓
LIVE

Qwen 3.6 Flash

128K context · multilingual

Generasi terbaru Qwen — cepat & hemat, dengan Bahasa Indonesia yang makin natural.

Rp 1.8K/ 1M token inFREE TIER ✓
LIVE

Kimi K2.7 Code

256K context · coding

Spesialis coding & long-context dari Moonshot. Jago refactor dan baca repo besar.

Rp 2.7K/ 1M token inFREE TIER ✓
LIVE

Qwen 2.5 72B

32K context · multilingual

Open-weight kuat untuk Bahasa Indonesia. Self-hosted via vLLM untuk privasi penuh.

Rp 7.1K/ 1M token inFREE TIER ✓
LIVE

MiniMax-M3

1M context · long-doc

Generasi terbaru — context window 1 juta token untuk RAG dokumen masif dengan latensi lebih rendah.

Rp 3.6K/ 1M token inFREE TIER ✓
LIVE

Claude Sonnet

200K context · agentic

Untuk agent & tool-use kompleks. Diteruskan langsung ke provider resmi.

Rp 53K/ 1M token in
LIVE

Mistral Large

128K context · open-weight

Model Eropa yang kuat untuk multibahasa, function calling, dan tool-use dengan lisensi fleksibel.

Rp 36K/ 1M token inFREE TIER ✓
LIVE

Step 3.7 Flash

128K context · cepat

Model cepat dari StepFun untuk inferensi hemat dan respons real-time.

Rp 1.8K/ 1M token inFREE TIER ✓
LIVE

GPT-OSS 120B

128K context · open-weight

Model open-weight 120B dari OpenAI. Bisa di-self-host, transparan & fleksibel.

Rp 2.7K/ 1M token inFREE TIER ✓
LIVE

Gemma 4 26B

64K context · open-weight

Open-weight ringan dari Google DeepMind. Efisien untuk fine-tuning lokal.

Rp 0.9K/ 1M token inFREE TIER ✓
LIVE

Gemini 3.5 Flash

1M context · multimodal

Multimodal cepat dari Google — teks, gambar, dan audio dalam satu model.

Rp 1.3K/ 1M token inFREE TIER ✓
LIVE

Nemotron 3 Nano

64K context · reasoning

Model reasoning omni-modal nano dari NVIDIA. Gratis lewat NIM.

GratisFREE TIER ✓
BETA

HappyHorse 1.0

text→video · 1080p

Model text-to-video. Ubah prompt jadi klip video sinematik.

Rp 8K/ klip video
LIVE

GPT-5

256K context · flagship

Model flagship OpenAI generasi terbaru untuk tugas paling kompleks.

Rp 22K/ 1M token in
LIVE

GPT-4o

128K context · multimodal

Model multimodal cepat untuk teks, gambar, dan audio.

Rp 45K/ 1M token in
LIVE

o3

200K context · reasoning

Model reasoning mendalam untuk problem-solving tingkat lanjut.

Rp 36K/ 1M token in
LIVE

Grok 4

256K context · realtime

Model xAI dengan akses pengetahuan real-time dari X.

Rp 53K/ 1M token in
LIVE

Llama 4 Maverick

1M context · open-weight

Model open-weight Meta dengan context window sangat panjang.

Rp 3.6K/ 1M token inFREE TIER ✓
LIVE

Command A

256K context · RAG

Model Cohere yang dioptimalkan untuk RAG & enterprise.

Rp 45K/ 1M token in
LIVE

Sonar Pro

search-grounded

Model Perplexity dengan jawaban ter-grounding pencarian web.

Rp 53K/ 1M token in
LIVE

GLM-4.6

200K context · coding

Model Zhipu yang kuat untuk coding & agentic task.

Rp 11K/ 1M token inFREE TIER ✓
LIVE

Yi-Lightning

16K context · cepat

Model 01.AI super cepat & hemat untuk task ringan.

Rp 1.8K/ 1M token inFREE TIER ✓
LIVE

Phi-4

16K context · open-weight

Model kecil Microsoft yang efisien untuk on-device.

Rp 1.2K/ 1M token inFREE TIER ✓
SMART

auto/naraya.ai

dynamic · cost-aware

Biar router yang pilih. Routing otomatis ke model termurah yang memenuhi kualitas.

Adaptif· hemat hingga 40%FREE TIER ✓
LIVE

DeepSeek 4 Flash

128K context · cepat

Versi ringan super cepat. Ideal untuk CS bot, WhatsApp agent, dan task volume tinggi.

Rp 2.5K/ 1M token inFREE TIER ✓
LIVE

Qwen 3.6 Flash

128K context · multilingual

Generasi terbaru Qwen — cepat & hemat, dengan Bahasa Indonesia yang makin natural.

Rp 1.8K/ 1M token inFREE TIER ✓
LIVE

Kimi K2.7 Code

256K context · coding

Spesialis coding & long-context dari Moonshot. Jago refactor dan baca repo besar.

Rp 2.7K/ 1M token inFREE TIER ✓
LIVE

Qwen 2.5 72B

32K context · multilingual

Open-weight kuat untuk Bahasa Indonesia. Self-hosted via vLLM untuk privasi penuh.

Rp 7.1K/ 1M token inFREE TIER ✓
LIVE

MiniMax-M3

1M context · long-doc

Generasi terbaru — context window 1 juta token untuk RAG dokumen masif dengan latensi lebih rendah.

Rp 3.6K/ 1M token inFREE TIER ✓
LIVE

Claude Sonnet

200K context · agentic

Untuk agent & tool-use kompleks. Diteruskan langsung ke provider resmi.

Rp 53K/ 1M token in
LIVE

Mistral Large

128K context · open-weight

Model Eropa yang kuat untuk multibahasa, function calling, dan tool-use dengan lisensi fleksibel.

Rp 36K/ 1M token inFREE TIER ✓
LIVE

Step 3.7 Flash

128K context · cepat

Model cepat dari StepFun untuk inferensi hemat dan respons real-time.

Rp 1.8K/ 1M token inFREE TIER ✓
LIVE

GPT-OSS 120B

128K context · open-weight

Model open-weight 120B dari OpenAI. Bisa di-self-host, transparan & fleksibel.

Rp 2.7K/ 1M token inFREE TIER ✓
LIVE

Gemma 4 26B

64K context · open-weight

Open-weight ringan dari Google DeepMind. Efisien untuk fine-tuning lokal.

Rp 0.9K/ 1M token inFREE TIER ✓
LIVE

Gemini 3.5 Flash

1M context · multimodal

Multimodal cepat dari Google — teks, gambar, dan audio dalam satu model.

Rp 1.3K/ 1M token inFREE TIER ✓
LIVE

Nemotron 3 Nano

64K context · reasoning

Model reasoning omni-modal nano dari NVIDIA. Gratis lewat NIM.

GratisFREE TIER ✓
BETA

HappyHorse 1.0

text→video · 1080p

Model text-to-video. Ubah prompt jadi klip video sinematik.

Rp 8K/ klip video
LIVE

GPT-5

256K context · flagship

Model flagship OpenAI generasi terbaru untuk tugas paling kompleks.

Rp 22K/ 1M token in
LIVE

GPT-4o

128K context · multimodal

Model multimodal cepat untuk teks, gambar, dan audio.

Rp 45K/ 1M token in
LIVE

o3

200K context · reasoning

Model reasoning mendalam untuk problem-solving tingkat lanjut.

Rp 36K/ 1M token in
LIVE

Grok 4

256K context · realtime

Model xAI dengan akses pengetahuan real-time dari X.

Rp 53K/ 1M token in
LIVE

Llama 4 Maverick

1M context · open-weight

Model open-weight Meta dengan context window sangat panjang.

Rp 3.6K/ 1M token inFREE TIER ✓
LIVE

Command A

256K context · RAG

Model Cohere yang dioptimalkan untuk RAG & enterprise.

Rp 45K/ 1M token in
LIVE

Sonar Pro

search-grounded

Model Perplexity dengan jawaban ter-grounding pencarian web.

Rp 53K/ 1M token in
LIVE

GLM-4.6

200K context · coding

Model Zhipu yang kuat untuk coding & agentic task.

Rp 11K/ 1M token inFREE TIER ✓
LIVE

Yi-Lightning

16K context · cepat

Model 01.AI super cepat & hemat untuk task ringan.

Rp 1.8K/ 1M token inFREE TIER ✓
LIVE

Phi-4

16K context · open-weight

Model kecil Microsoft yang efisien untuk on-device.

Rp 1.2K/ 1M token inFREE TIER ✓
SMART

auto/naraya.ai

dynamic · cost-aware

Biar router yang pilih. Routing otomatis ke model termurah yang memenuhi kualitas.

Adaptif· hemat hingga 40%FREE TIER ✓
Harga sesuai paket

💡 Model dengan badge FREE TIER gratis dipakai sampai kuota harian habis. Lewat kuota — atau memakai model premium — penggunaan dikenakan tarif per token sesuai harga yang tertera di atas.

Satu API key, latensi rendah, key rotation otomatis. Akses DeepSeek V3, Qwen, MiniMax, hingga model proprietary lewat satu endpoint OpenAI-compatible — dengan kuota gratis harian untuk developer Indonesia.

Token Hari Ini
2.84M
▲ 18% vs kemarin
Latensi p50
312ms
stabil · TTFT
Uptime 30 Hari
99.94%
operasional
Model Aktif
24+
multi-provider

01Hubungkan ke Tools-mu

OpenAI-compatible — Gateway Naraya langsung jalan di tools coding & agent favoritmu. Cukup ganti base_url & API key.

Claude Code

Coding agent CLI

Codex

OpenAI CLI agent

OpenClaw

Open-source agent

Hermes Agent

Orkestrator Naraya

Claude Code

Coding agent CLI

Codex

OpenAI CLI agent

OpenClaw

Open-source agent

Hermes Agent

Orkestrator Naraya

02Membership

Mulai gratis. Tanpa kartu kredit, tanpa kontrak.

Free
Gratis
  • 5M token/hari · reset 07:00 WIB
  • Routing otomatis & key rotation
  • Community support
  • Buat 1 API key
Model yang bisa diakses
Claude Sonnet 4.6Qwen 3.6 FlashMistralDeepSeek 4 Flash
Mulai Gratis
Naraya Starter
Rp 10K/hari
  • 15M token/hari · reset 07:00 WIB
  • Prioritas routing & prompt caching
  • Akses 9 model unggulan
  • Buat 2 API key
  • Diskon 3% harga token semua model
Model yang bisa diakses
Claude Sonnet 4.6DeepSeek 4 FlashQwen 3.6 FlashMiniMax-M3Nemotron 3 NanoStep 3.7 FlashGPT-OSS 120BGemma 4 26BGemini 3.5 Flash
Pilih Starter
Naraya Player
Rp 20K/hari
  • 30M token/hari · reset 07:00 WIB
  • Prioritas tinggi & prompt caching
  • Akses 12 model · termasuk Claude Opus
  • Buat 5 API key
  • Diskon 7% harga token semua model
Model yang bisa diakses
Claude Sonnet 4.6Claude Opus 4.6DeepSeek 4 ProDeepSeek 4 FlashQwen 3.6 FlashMiniMax-M3Kimi K2.7 CodeMistralStep 3.7 FlashGPT-OSS 120BGemma 4 26BGemini 3.5 Flash
Pilih Player
★ Naraya Master
Rp 40K/hari
  • 50M token/hari · reset 07:00 WIB
  • Prioritas maksimum & dedicated SLA
  • Akses SEMUA model · eksklusif Claude Opus 4.8
  • API key unlimited
  • Diskon 15% harga token semua model
Model yang bisa diakses
Claude Opus 4.8Claude Opus 4.7Claude Opus 4.6Claude Sonnet 4.6DeepSeek 4 ProDeepSeek 4 FlashQwen 3.6 FlashQwen 2.5 72BKimi K2.7 CodeMiniMax-M3Mistral LargeStep 3.7 FlashGPT-OSS 120BGemma 4 26BGemini 3.5 FlashNemotron 3 NanoHappyHorse 1.0GPT-5GPT-4oo3Grok 4Llama 4 MaverickCommand ASonar ProGLM-4.6Yi-LightningPhi-4
Pilih Master →

03Pertanyaan Umum

Hal-hal yang paling sering ditanyakan tentang Gateway Naraya.

Apa itu Gateway Naraya?+
Satu endpoint API yang kompatibel dengan OpenAI untuk mengakses puluhan model AI (DeepSeek, Qwen, Claude, Gemini, GPT, Grok, Llama, dan lainnya) lewat satu API key.
Bagaimana cara mulai?+
Masuk lewat magic link, dapatkan API key di dashboard, lalu arahkan base_url ke https://gateway.naraya.ai/v1. Tidak perlu mengubah kode SDK OpenAI Anda.
Apakah ada tier gratis?+
Ya. Tier Free memberi 5M token/hari yang direset setiap pukul 07:00 WIB, tanpa kartu kredit.
Apakah kompatibel dengan SDK OpenAI?+
Sepenuhnya. Cukup ganti base_url dan api_key — drop-in replacement untuk Chat Completions & Responses API.
Bagaimana penagihannya?+
Tier berbayar (Starter, Player, Master) ditagih harian dalam Rupiah sesuai paket. Kuota tidak dapat diuangkan kembali.
Apa yang terjadi jika kuota habis?+
Permintaan akan ditolak hingga reset berikutnya (07:00 WIB), atau Anda bisa upgrade tier untuk kuota lebih besar.
Apakah data saya aman?+
Isi prompt tidak disimpan permanen untuk pelatihan. Detail selengkapnya ada di Kebijakan Privasi.
Bagaimana cara mendapat dukungan?+
Hubungi kami via Telegram @narayaai atau email admin@naraya.ai.
Penggunaan

Selamat Datang

API Request
🔢
Total Token
💳
Total Spend
🎁
Sisa Kuota Free
Laju Request
🎯
Cache Hit Rate
📊
Token Volume

Kuota Free TokenFree

0 / 5M token
0% terpakaiReset 07:00 WIB

Ringkasan Akun

PaketNaraya Master
Kuota harian50M token
Terpakai12.4M
Rate limit30 req/menit
API keyunlimited
Diskon token15%
Reset07:00 WIB
Status● Aktif

Analisa Penggunaan Model

Hari ini
Billing

Membership & Kredit

Topup Kredit

untuk pemakaian di atas kuota free
Saldo saat ini
Rp 0
Pembayaran otomatis (QRIS / Virtual Account) segera hadir. Saldo dipotong sesuai harga model × diskon tier saat kuota free habis.

Pembelian Membership

Paket aktif Anda ditandai. Upgrade untuk kuota, rate limit, model, & diskon lebih besar.
Katalog

Semua Model

Total 0 model. Badge = termasuk paket Free Anda.
Kredensial

API Key

Key Anda

sk-nara-vip-x9f2a7c4e1b8d36
⚠ Jaga kerahasiaan key. Jangan taruh di repo publik atau kode sisi-klien.

Base URL

https://gateway.naraya.ai/v1
Header autentikasi: Authorization: Bearer <API_KEY> — kompatibel penuh dengan SDK OpenAI.

Contoh Penggunaan


    
    
   

Parameter Permintaan

ParameterTipeKeterangan
modelstringID model, mis. auto/naraya.ai (router otomatis) atau model spesifik dari katalog.
messagesarrayDaftar pesan percakapan: [{"role":"user","content":"..."}]. Role: system / user / assistant.
streambooleantrue = respons streaming (SSE) token demi token; false = sekali balas penuh.
temperaturenumber0–2. Makin tinggi makin kreatif/acak; rendah = lebih deterministik. Default 0.7.
max_tokensintegerBatas token output. Mempengaruhi reservasi kuota/saldo (reserve-then-settle).
reasoning_effortstringlow / medium / high — kedalaman reasoning untuk model yang mendukung (mis. seri o, GPT-5, Claude reasoning).