Q
Первый Rubin R100 NVL72 облачный провайдер

AI Суперклауд для масштабирования

NVIDIA Rubin R100 NVL72 нового поколения + Groq LPX инференс в реальном времени. $0.048/кВт·ч. Нулевые налоги в СЭЗ.

Доступ к GPU с июля 2027

🚀 GPU access from July 2027. Join the waitlist to reserve $500 in free credits and get early access pricing.

8
МВт мощности
$0.048
/кВт·ч энергия
<10
мс задержка
0%
налогов в СЭЗ

Почему лидеры выбирают Qube Compute

Производительность нового поколения

NVIDIA Vera Rubin R100 NVL72 — в 5 раз мощнее H100 на токен. 1,400+ ExaFLOPS FP4 на стойку. NVLink 6.0.

Непревзойдённая экономика

$0.048/кВт·ч на газовой генерации — в 3 раза дешевле AWS/Azure. АБХМ охлаждение с PUE 1.10. 0% налогов в СЭЗ.

Халяль-совместимый

Единственный GPU-облако с сертификатом AFSA/МФЦА. Структура Мудараба. Доступ к $4.5 трлн исламских суверенных фондов.

Developer-First API

Deploy GPUs in Seconds

Full REST API, Python SDK, Node.js SDK, and CLI. Spin up NVIDIA Rubin R100 NVL72 instances or call Groq LPX inference with a single command.

1
Get API Key
Sign up and generate your API key in the dashboard
2
Launch Instance
Choose GPU type, count, and container image
3
Train or Infer
SSH in for training, or use Groq API for <10ms inference
import qube

client = qube.Client(api_key="your-api-key")

# Launch a GPU instance
instance = client.instances.create(
    gpu_type="rubin-r100-nvl72",
    gpu_count=8,
    image="nvidia/pytorch:24.04",
    region="almaty-sez"
)

print(f"Instance {instance.id} is {instance.status}")
print(f"SSH: ssh root@{instance.ip}")

# Run inference with Groq LPX
response = client.inference.create(
    model="llama-3.1-70b",
    messages=[{"role": "user", "content": "Hello!"}],
    max_tokens=512
)
print(response.choices[0].message.content)
# Latency: 8ms
api.qubecompute.com
SDK Access: Private Beta for LOI Signatories

Пять неоспоримых преимуществ

Ни один облачный провайдер не сочетает эти сильные стороны

0
months monopoly

First Rubin R100 NVL72 Cloud Provider

No NVL72 in KZ, UZ, KG. Nearest competitor with Rubin — Finland (Nebius), UAE (G42). 18-24 month exclusive window.

0
/kWh

3x Cheaper Energy

Gas-powered generation at $0.048/kWh vs $0.09-0.18 at Western competitors. ABHM absorption cooling, PUE 1.10.

0
addressable market

Only Sharia-Compliant GPU Cloud

AFSA/AIFC certified Mudaraba structure. Access to PIF ($925B), QIA ($475B), ADIA ($993B) sovereign wealth funds.

0
taxes until 2029

SEZ Tax Exemptions

0% corporate tax, VAT, personal income tax in SEZ PIT Alatau. Government investment contract guarantees.

0
ms latency

Groq LPX Real-Time Inference

Sub-10ms LLM inference API globally. Unique Rubin + Groq combination for training + real-time serving.

Performance

Benchmark Comparisons

NVIDIA Rubin R100 NVL72 delivers up to 5x more performance per dollar compared to H100. Combined with Groq LPX for inference — unmatched speed and efficiency.

LLaMA 3.1 70B Training

Time to train (1T tokens)
Rubin R100 NVL72~3 days
H100 SXM (8×)~15 days
A100 SXM (8×)~38 days

Inference Throughput

Tokens/sec (LLaMA 70B)
Groq LPX~3,000 tok/s
Rubin R100~800 tok/s
H100 TensorRT~350 tok/s
A100~120 tok/s

Memory Bandwidth

Per rack
Rubin R100 NVL72468 TB/s
GB200 NVL72~380 TB/s
H100 SXM (8×)26.4 TB/s

FP4 Performance

Per rack
Rubin R100 NVL721,400+ ExaFLOPS
GB200 NVL72~720 ExaFLOPS
H100 SXM (8×)~16 ExaFLOPS

* Benchmark estimates based on NVIDIA published specifications and industry testing. Actual performance may vary by workload. Rubin R100 NVL72 specs from NVIDIA GTC 2025 announcements.

Экономия до 70%

Посмотрите сколько вы сэкономите

Сравните Qube Compute с крупными GPU-облачными провайдерами. Rubin R100 + дешёвая энергия = непревзойдённая экономика.

172 (full rack)
1h24h
ПровайдерGPU$/GPU/часСтоимость/месСтоимость/годЭкономия
Qube ComputeЛучшая ценаRubin R100$14$80,640$967,680
AWS (p5.48xlarge)H100$163.85
($32.77 x 5hrs)
$943,776$11,325,31291%
$10,357,632/yr
Azure (ND H100 v5)H100$136.00
($27.20 x 5hrs)
$783,360$9,400,32090%
$8,432,640/yr
GCP (a3-highgpu-8g)H100$156.10
($31.22 x 5hrs)
$899,136$10,789,63291%
$9,821,952/yr
CoreWeaveH100$23.80
($4.76 x 5hrs)
$137,088$1,645,05641%
$677,376/yr
Lambda CloudH100$17.45
($3.49 x 5hrs)
$100,512$1,206,14420%
$238,464/yr

* Qube Compute использует якорные цены ($14/GPU-пакет/ч). Цены конкурентов из публичных прайс-листов 2025 г.

Готовы экономить в 3 раза на GPU?
Клиентская воронка

Корпоративный спрос уже формируется

Активные LOI и переговоры с предприятиями в 4 секторах. Ёмкость Фазы 1 (8 стоек) распределяется между якорными клиентами.

3+
LOI в воронке
576+
GPU запрошено
$8M+
Годовая стоимость контрактов
4
Отраслевых секторов

Активная клиентская воронка (имена под NDA)

СекторРегионПрименениеЁмкость GPUСтатус
Финансовые услугиБлижний ВостокАнтифрод ML, кредитный скорингНесколько стоекLOI в процессе
Энергетика и промышленностьЕвразияПредиктивная аналитика, оптимизацияВыделенная стойкаLOI в процессе
Государство и госсекторЕвразияНациональная AI-платформа, NLPМульти-стоечный кластерНа обсуждении
Здравоохранение и биотехБлижний ВостокРазработка лекарств, диагностикаВыделенная стойкаНа обсуждении

Имена клиентов защищены NDA. Подробности доступны по запросу инвесторов под NDA.

AI-решения для каждой отрасли

Инфраструктура, созданная для самых требовательных задач

Oil & Gas AI

Seismic analysis, predictive maintenance, and well optimization for KMG, TCO, Karachaganak.

Financial AI

Anti-fraud ML, algorithmic trading signals, and risk scoring for banks and fintech.

Government AI

National digitalization projects, NLP for public services, and smart city infrastructure.

Healthcare AI

Real-time diagnostics, drug discovery, and molecular dynamics on Groq LPX under 10ms.

Технологические партнёры и экосистема

Построено на партнёрствах с мировыми лидерами AI-инфраструктуры, финансов и комплаенса

NVIDIA
GPU Partner
Groq
Inference Partner
AIFC
Legal Framework
Al Hilal Bank
Escrow Partner
ComplyAdvantage
KYC/AML
Astana Hub
Tech Ecosystem

Built for Every Industry

Serving enterprises globally — from AI startups to Fortune 500

AI Startups
Fortune 500
Sovereign Wealth Funds
Fintech
Healthcare AI
Oil & Gas
Research Labs
Government AI

Готовы масштабировать ваш AI?

Ограниченная ёмкость Фазы 1 — 8 стоек. Бронируйте сейчас по якорным ценам.

Доступ к GPU с июля 2027. Бронируйте сейчас для якорных цен.