Модели с открытым исходным кодом на корпоративной инфраструктуре
Мы запускаем самые популярные модели с открытым исходным кодом на наших серверах. Тот же API, без настройки, полный контроль.
Данные остаются у нас
Ваши данные никогда не покидают нашу инфраструктуру. Никаких сторонних маршрутов для собственных моделей.
Выделенные GPU
Модели работают на выделенных NVIDIA A100/H100 с гарантированной вычислительной мощностью.
SLA 99.9%
Корпоративная доступность с автоматическим резервированием и мониторингом.
20 боевых моделей
Все модели работают на нашем оптимизированном стеке вывода и выделенных GPU. Используйте их через тот же OpenAI-совместимый API.
Llama 4 Behemoth
Meta · 2T MoE
Вход / 1M
$0.90
Выход / 1M
$2.70
airouter-cloud/llama-4-behemoth
Llama 4 Maverick
Meta · 400B MoE
Вход / 1M
$0.20
Выход / 1M
$0.60
airouter-cloud/llama-4-maverick
Llama 4 Scout
Meta · 109B MoE
Вход / 1M
$0.10
Выход / 1M
$0.30
airouter-cloud/llama-4-scout
Qwen 3 235B
Alibaba · 235B MoE
Вход / 1M
$0.25
Выход / 1M
$0.75
airouter-cloud/qwen-3-235b
Qwen 3 32B
Alibaba · 32B
Вход / 1M
$0.08
Выход / 1M
$0.16
airouter-cloud/qwen-3-32b
Qwen 3 8B
Alibaba · 8B
Вход / 1M
$0.02
Выход / 1M
$0.04
airouter-cloud/qwen-3-8b
DeepSeek V3.2
DeepSeek · 685B MoE
Вход / 1M
$0.27
Выход / 1M
$1.10
airouter-cloud/deepseek-v3.2
DeepSeek R1.1
DeepSeek · 685B MoE
Вход / 1M
$0.55
Выход / 1M
$2.19
airouter-cloud/deepseek-r1.1
Mistral Large 3
Mistral · 160B MoE
Вход / 1M
$2.00
Выход / 1M
$6.00
airouter-cloud/mistral-large-3
Mistral Medium 3
Mistral · 70B
Вход / 1M
$0.40
Выход / 1M
$2.00
airouter-cloud/mistral-medium-3
Mistral Small 3.2
Mistral · 24B
Вход / 1M
$0.10
Выход / 1M
$0.30
airouter-cloud/mistral-small-3.2
Gemma 3 27B
Google · 27B
Вход / 1M
$0.07
Выход / 1M
$0.14
airouter-cloud/gemma-3-27b
Gemma 3 12B
Google · 12B
Вход / 1M
$0.04
Выход / 1M
$0.08
airouter-cloud/gemma-3-12b
Phi-5
Microsoft · 14B
Вход / 1M
$0.04
Выход / 1M
$0.08
airouter-cloud/phi-5
Command A
Cohere · 111B
Вход / 1M
$0.50
Выход / 1M
$1.50
airouter-cloud/command-a
Qwen 3 Coder 32B
Alibaba · 32B
Вход / 1M
$0.08
Выход / 1M
$0.16
airouter-cloud/qwen-3-coder-32b
DeepSeek Coder V2.5
DeepSeek · 236B MoE
Вход / 1M
$0.14
Выход / 1M
$0.28
airouter-cloud/deepseek-coder-v2.5
StarCoder3
BigCode · 22B
Вход / 1M
$0.05
Выход / 1M
$0.10
airouter-cloud/starcoder3
Llama Guard 4
Meta · 12B
Вход / 1M
$0.03
Выход / 1M
$0.06
airouter-cloud/llama-guard-4
Mistral Nemo 2
Mistral · 12B
Вход / 1M
$0.03
Выход / 1M
$0.06
airouter-cloud/mistral-nemo-2
Разворачиваем любую модель
Нужна конкретная модель? Развернём любую модель с HuggingFace на нашей инфраструктуре за 24 часа. Дообученные модели, кастомные архитектуры, приватные веса — справимся со всем.
Тот же API, что вы уже используете
Собственные модели используют тот же эндпоинт и формат запроса. Просто используйте префикс airouter-cloud/.
from openai import OpenAI
client = OpenAI(
base_url="https://api.airouter.kz/api/v1",
api_key="air_live_your_key_here"
)
# Use a self-hosted model — same API as any other model
response = client.chat.completions.create(
model="airouter-cloud/llama-4-maverick",
messages=[
{"role": "user", "content": "Write a Python quicksort function"}
]
)
print(response.choices[0].message.content)Готовы начать?
Используйте собственные модели уже сегодня с тем же API-ключом и эндпоинтом. Без настройки.