Перейти к содержимому
20 моделей · выделенные GPU · тот же API

Модели с открытым исходным кодом на корпоративной инфраструктуре

Мы запускаем самые популярные модели с открытым исходным кодом на наших серверах. Тот же API, без настройки, полный контроль.

Данные остаются у нас

Ваши данные никогда не покидают нашу инфраструктуру. Никаких сторонних маршрутов для собственных моделей.

Выделенные GPU

Модели работают на выделенных NVIDIA A100/H100 с гарантированной вычислительной мощностью.

SLA 99.9%

Корпоративная доступность с автоматическим резервированием и мониторингом.

20 боевых моделей

Все модели работают на нашем оптимизированном стеке вывода и выделенных GPU. Используйте их через тот же OpenAI-совместимый API.

Llama 4 Behemoth

Meta · 2T MoE

1M
GeneralCodeReasoning

Вход / 1M

$0.90

Выход / 1M

$2.70

airouter-cloud/llama-4-behemoth

Llama 4 Maverick

Meta · 400B MoE

1M
GeneralVisionCode

Вход / 1M

$0.20

Выход / 1M

$0.60

airouter-cloud/llama-4-maverick

Llama 4 Scout

Meta · 109B MoE

10M
GeneralVision

Вход / 1M

$0.10

Выход / 1M

$0.30

airouter-cloud/llama-4-scout

Qwen 3 235B

Alibaba · 235B MoE

128K
GeneralCodeReasoning

Вход / 1M

$0.25

Выход / 1M

$0.75

airouter-cloud/qwen-3-235b

Qwen 3 32B

Alibaba · 32B

128K
GeneralCode

Вход / 1M

$0.08

Выход / 1M

$0.16

airouter-cloud/qwen-3-32b

Qwen 3 8B

Alibaba · 8B

128K
General

Вход / 1M

$0.02

Выход / 1M

$0.04

airouter-cloud/qwen-3-8b

DeepSeek V3.2

DeepSeek · 685B MoE

128K
GeneralCode

Вход / 1M

$0.27

Выход / 1M

$1.10

airouter-cloud/deepseek-v3.2

DeepSeek R1.1

DeepSeek · 685B MoE

128K
Reasoning

Вход / 1M

$0.55

Выход / 1M

$2.19

airouter-cloud/deepseek-r1.1

Mistral Large 3

Mistral · 160B MoE

256K
GeneralCodeReasoning

Вход / 1M

$2.00

Выход / 1M

$6.00

airouter-cloud/mistral-large-3

Mistral Medium 3

Mistral · 70B

256K
General

Вход / 1M

$0.40

Выход / 1M

$2.00

airouter-cloud/mistral-medium-3

Mistral Small 3.2

Mistral · 24B

128K
General

Вход / 1M

$0.10

Выход / 1M

$0.30

airouter-cloud/mistral-small-3.2

Gemma 3 27B

Google · 27B

128K
GeneralVision

Вход / 1M

$0.07

Выход / 1M

$0.14

airouter-cloud/gemma-3-27b

Gemma 3 12B

Google · 12B

128K
GeneralVision

Вход / 1M

$0.04

Выход / 1M

$0.08

airouter-cloud/gemma-3-12b

Phi-5

Microsoft · 14B

128K
GeneralReasoning

Вход / 1M

$0.04

Выход / 1M

$0.08

airouter-cloud/phi-5

Command A

Cohere · 111B

256K
GeneralCode

Вход / 1M

$0.50

Выход / 1M

$1.50

airouter-cloud/command-a

Qwen 3 Coder 32B

Alibaba · 32B

128K
Code

Вход / 1M

$0.08

Выход / 1M

$0.16

airouter-cloud/qwen-3-coder-32b

DeepSeek Coder V2.5

DeepSeek · 236B MoE

128K
Code

Вход / 1M

$0.14

Выход / 1M

$0.28

airouter-cloud/deepseek-coder-v2.5

StarCoder3

BigCode · 22B

128K
Code

Вход / 1M

$0.05

Выход / 1M

$0.10

airouter-cloud/starcoder3

Llama Guard 4

Meta · 12B

128K
Safety

Вход / 1M

$0.03

Выход / 1M

$0.06

airouter-cloud/llama-guard-4

Mistral Nemo 2

Mistral · 12B

128K
General

Вход / 1M

$0.03

Выход / 1M

$0.06

airouter-cloud/mistral-nemo-2

Разворачиваем любую модель

Нужна конкретная модель? Развернём любую модель с HuggingFace на нашей инфраструктуре за 24 часа. Дообученные модели, кастомные архитектуры, приватные веса — справимся со всем.

Тот же API, что вы уже используете

Собственные модели используют тот же эндпоинт и формат запроса. Просто используйте префикс airouter-cloud/.

Python
from openai import OpenAI

client = OpenAI(
    base_url="https://api.airouter.kz/api/v1",
    api_key="air_live_your_key_here"
)

# Use a self-hosted model — same API as any other model
response = client.chat.completions.create(
    model="airouter-cloud/llama-4-maverick",
    messages=[
        {"role": "user", "content": "Write a Python quicksort function"}
    ]
)

print(response.choices[0].message.content)

Готовы начать?

Используйте собственные модели уже сегодня с тем же API-ключом и эндпоинтом. Без настройки.