Деректер біздің серверлерде қалады
Сіздің деректеріңіз инфрақұрылымымыздан шықпайды. Self-hosted модельдер үшін үшінші тарап маршруттары жоқ.
Бөлінген GPU бөлу
Модельдер кепілденген есептеу қуатымен арнайы NVIDIA A100/H100 GPU-ларында жұмыс істейді.
99.9% SLA
Автоматты резервтеумен және мониторингпен корпоративтік деңгейдегі қолжетімділік.
20 өнімдік модель
Барлық модельдер біздің оптимизацияланған inference-стек пен арнайы GPU-инфрақұрылымда жұмыс істейді. Сіз білетін OpenAI-үйлесімді API арқылы қолданыңыз.
Llama 4 Behemoth
Meta · 2T MoE
Кіріс / 1M
$0.90
Шығыс / 1M
$2.70
airouter-cloud/llama-4-behemoth
Llama 4 Maverick
Meta · 400B MoE
Кіріс / 1M
$0.20
Шығыс / 1M
$0.60
airouter-cloud/llama-4-maverick
Llama 4 Scout
Meta · 109B MoE
Кіріс / 1M
$0.10
Шығыс / 1M
$0.30
airouter-cloud/llama-4-scout
Qwen 3 235B
Alibaba · 235B MoE
Кіріс / 1M
$0.25
Шығыс / 1M
$0.75
airouter-cloud/qwen-3-235b
Qwen 3 32B
Alibaba · 32B
Кіріс / 1M
$0.08
Шығыс / 1M
$0.16
airouter-cloud/qwen-3-32b
Qwen 3 8B
Alibaba · 8B
Кіріс / 1M
$0.02
Шығыс / 1M
$0.04
airouter-cloud/qwen-3-8b
DeepSeek V3.2
DeepSeek · 685B MoE
Кіріс / 1M
$0.27
Шығыс / 1M
$1.10
airouter-cloud/deepseek-v3.2
DeepSeek R1.1
DeepSeek · 685B MoE
Кіріс / 1M
$0.55
Шығыс / 1M
$2.19
airouter-cloud/deepseek-r1.1
Mistral Large 3
Mistral · 160B MoE
Кіріс / 1M
$2.00
Шығыс / 1M
$6.00
airouter-cloud/mistral-large-3
Mistral Medium 3
Mistral · 70B
Кіріс / 1M
$0.40
Шығыс / 1M
$2.00
airouter-cloud/mistral-medium-3
Mistral Small 3.2
Mistral · 24B
Кіріс / 1M
$0.10
Шығыс / 1M
$0.30
airouter-cloud/mistral-small-3.2
Gemma 3 27B
Google · 27B
Кіріс / 1M
$0.07
Шығыс / 1M
$0.14
airouter-cloud/gemma-3-27b
Gemma 3 12B
Google · 12B
Кіріс / 1M
$0.04
Шығыс / 1M
$0.08
airouter-cloud/gemma-3-12b
Phi-5
Microsoft · 14B
Кіріс / 1M
$0.04
Шығыс / 1M
$0.08
airouter-cloud/phi-5
Command A
Cohere · 111B
Кіріс / 1M
$0.50
Шығыс / 1M
$1.50
airouter-cloud/command-a
Qwen 3 Coder 32B
Alibaba · 32B
Кіріс / 1M
$0.08
Шығыс / 1M
$0.16
airouter-cloud/qwen-3-coder-32b
DeepSeek Coder V2.5
DeepSeek · 236B MoE
Кіріс / 1M
$0.14
Шығыс / 1M
$0.28
airouter-cloud/deepseek-coder-v2.5
StarCoder3
BigCode · 22B
Кіріс / 1M
$0.05
Шығыс / 1M
$0.10
airouter-cloud/starcoder3
Llama Guard 4
Meta · 12B
Кіріс / 1M
$0.03
Шығыс / 1M
$0.06
airouter-cloud/llama-guard-4
Mistral Nemo 2
Mistral · 12B
Кіріс / 1M
$0.03
Шығыс / 1M
$0.06
airouter-cloud/mistral-nemo-2
Кастомды модельді орналастыру
Нақты модель керек пе? Кез келген HuggingFace моделін 24 сағатта инфрақұрылымымызда орналастырамыз. Fine-tuned модельдер, кастомды архитектуралар, жеке салмақтар — бәрін шешеміз.
Сіз қолданып жүрген API
Self-hosted модельдер сол эндпоинтті және сұраныс форматын қолданады. Жай ғана airouter-cloud/ префиксін пайдаланыңыз.
from openai import OpenAI
client = OpenAI(
base_url="https://api.airouter.kz/api/v1",
api_key="air_live_your_key_here"
)
# Use a self-hosted model — same API as any other model
response = client.chat.completions.create(
model="airouter-cloud/llama-4-maverick",
messages=[
{"role": "user", "content": "Write a Python quicksort function"}
]
)
print(response.choices[0].message.content)Бастауға дайынсыз ба?
Сол API кілті мен эндпоинтпен бүгіннен бастап self-hosted модельдерді қолданыңыз. Баптау қажет емес.