Мазмұнға өту
20 модель · арнайы GPU · бірдей API

Open Source модельдер, enterprise инфрақұрылым

Ең танымал open-source модельдерді өз серверлерімізде іске қосамыз. Сол API, орнатусыз, толық бақылау.

Деректер біздің серверлерде қалады

Сіздің деректеріңіз инфрақұрылымымыздан шықпайды. Self-hosted модельдер үшін үшінші тарап маршруттары жоқ.

Бөлінген GPU бөлу

Модельдер кепілденген есептеу қуатымен арнайы NVIDIA A100/H100 GPU-ларында жұмыс істейді.

99.9% SLA

Автоматты резервтеумен және мониторингпен корпоративтік деңгейдегі қолжетімділік.

20 өнімдік модель

Барлық модельдер біздің оптимизацияланған inference-стек пен арнайы GPU-инфрақұрылымда жұмыс істейді. Сіз білетін OpenAI-үйлесімді API арқылы қолданыңыз.

Llama 4 Behemoth

Meta · 2T MoE

1M
GeneralCodeReasoning

Кіріс / 1M

$0.90

Шығыс / 1M

$2.70

airouter-cloud/llama-4-behemoth

Llama 4 Maverick

Meta · 400B MoE

1M
GeneralVisionCode

Кіріс / 1M

$0.20

Шығыс / 1M

$0.60

airouter-cloud/llama-4-maverick

Llama 4 Scout

Meta · 109B MoE

10M
GeneralVision

Кіріс / 1M

$0.10

Шығыс / 1M

$0.30

airouter-cloud/llama-4-scout

Qwen 3 235B

Alibaba · 235B MoE

128K
GeneralCodeReasoning

Кіріс / 1M

$0.25

Шығыс / 1M

$0.75

airouter-cloud/qwen-3-235b

Qwen 3 32B

Alibaba · 32B

128K
GeneralCode

Кіріс / 1M

$0.08

Шығыс / 1M

$0.16

airouter-cloud/qwen-3-32b

Qwen 3 8B

Alibaba · 8B

128K
General

Кіріс / 1M

$0.02

Шығыс / 1M

$0.04

airouter-cloud/qwen-3-8b

DeepSeek V3.2

DeepSeek · 685B MoE

128K
GeneralCode

Кіріс / 1M

$0.27

Шығыс / 1M

$1.10

airouter-cloud/deepseek-v3.2

DeepSeek R1.1

DeepSeek · 685B MoE

128K
Reasoning

Кіріс / 1M

$0.55

Шығыс / 1M

$2.19

airouter-cloud/deepseek-r1.1

Mistral Large 3

Mistral · 160B MoE

256K
GeneralCodeReasoning

Кіріс / 1M

$2.00

Шығыс / 1M

$6.00

airouter-cloud/mistral-large-3

Mistral Medium 3

Mistral · 70B

256K
General

Кіріс / 1M

$0.40

Шығыс / 1M

$2.00

airouter-cloud/mistral-medium-3

Mistral Small 3.2

Mistral · 24B

128K
General

Кіріс / 1M

$0.10

Шығыс / 1M

$0.30

airouter-cloud/mistral-small-3.2

Gemma 3 27B

Google · 27B

128K
GeneralVision

Кіріс / 1M

$0.07

Шығыс / 1M

$0.14

airouter-cloud/gemma-3-27b

Gemma 3 12B

Google · 12B

128K
GeneralVision

Кіріс / 1M

$0.04

Шығыс / 1M

$0.08

airouter-cloud/gemma-3-12b

Phi-5

Microsoft · 14B

128K
GeneralReasoning

Кіріс / 1M

$0.04

Шығыс / 1M

$0.08

airouter-cloud/phi-5

Command A

Cohere · 111B

256K
GeneralCode

Кіріс / 1M

$0.50

Шығыс / 1M

$1.50

airouter-cloud/command-a

Qwen 3 Coder 32B

Alibaba · 32B

128K
Code

Кіріс / 1M

$0.08

Шығыс / 1M

$0.16

airouter-cloud/qwen-3-coder-32b

DeepSeek Coder V2.5

DeepSeek · 236B MoE

128K
Code

Кіріс / 1M

$0.14

Шығыс / 1M

$0.28

airouter-cloud/deepseek-coder-v2.5

StarCoder3

BigCode · 22B

128K
Code

Кіріс / 1M

$0.05

Шығыс / 1M

$0.10

airouter-cloud/starcoder3

Llama Guard 4

Meta · 12B

128K
Safety

Кіріс / 1M

$0.03

Шығыс / 1M

$0.06

airouter-cloud/llama-guard-4

Mistral Nemo 2

Mistral · 12B

128K
General

Кіріс / 1M

$0.03

Шығыс / 1M

$0.06

airouter-cloud/mistral-nemo-2

Кастомды модельді орналастыру

Нақты модель керек пе? Кез келген HuggingFace моделін 24 сағатта инфрақұрылымымызда орналастырамыз. Fine-tuned модельдер, кастомды архитектуралар, жеке салмақтар — бәрін шешеміз.

Сіз қолданып жүрген API

Self-hosted модельдер сол эндпоинтті және сұраныс форматын қолданады. Жай ғана airouter-cloud/ префиксін пайдаланыңыз.

Python
from openai import OpenAI

client = OpenAI(
    base_url="https://api.airouter.kz/api/v1",
    api_key="air_live_your_key_here"
)

# Use a self-hosted model — same API as any other model
response = client.chat.completions.create(
    model="airouter-cloud/llama-4-maverick",
    messages=[
        {"role": "user", "content": "Write a Python quicksort function"}
    ]
)

print(response.choices[0].message.content)

Бастауға дайынсыз ба?

Сол API кілті мен эндпоинтпен бүгіннен бастап self-hosted модельдерді қолданыңыз. Баптау қажет емес.