What GPU hardware does Qube Compute use?

We deploy NVIDIA Vera Rubin R100 NVL72 — the most powerful commercially available GPU system with 1,400+ ExaFLOPS FP4 per rack and NVLink 6.0 fabric. We also offer Groq LPX for sub-10ms real-time inference.

How much does GPU cloud cost at Qube Compute?

Anchor contracts start at $14/GPU-package-hour (6-24 month terms). Cloud On-Demand is $19/hr and Spot/Night is $25/hr. Our energy cost of $0.048/kWh makes us 3x cheaper than AWS/Azure.

Is Qube Compute Sharia-compliant?

Yes. We are the world's only AFSA-certified halal GPU cloud. Our Mudaraba profit-sharing structure has zero debt (riba) and no derivatives (gharar). All payments are held in Sharia-compliant escrow at Al Hilal Bank.

Where is the data center located?

Our 8 MW Tier III TIA-942 facility is located in SEZ PIT Alatau, Almaty, Kazakhstan. The Special Economic Zone provides 0% corporate tax, VAT, and personal income tax until 2029.

How are payments protected?

All prepayments are held in escrow at Al Hilal Bank under AIFC English Common Law. Funds are released only upon verified GPU access delivery. If we fail to deliver — automatic full refund.

Первый Rubin R100 NVL72 облачный провайдер

AI Суперклауд для масштабирования

NVIDIA Rubin R100 NVL72 нового поколения + Groq LPX инференс в реальном времени. $0.048/кВт·ч. Нулевые налоги в СЭЗ.

Доступ к GPU с июля 2027

Забронировать GPU Связаться с отделом продаж

МВт мощности

$0.048

/кВт·ч энергия

<10

мс задержка

налогов в СЭЗ

Почему лидеры выбирают Qube Compute

Производительность нового поколения

NVIDIA Vera Rubin R100 NVL72 — в 5 раз мощнее H100 на токен. 1,400+ ExaFLOPS FP4 на стойку. NVLink 6.0.

Непревзойдённая экономика

$0.048/кВт·ч на газовой генерации — в 3 раза дешевле AWS/Azure. АБХМ охлаждение с PUE 1.10. 0% налогов в СЭЗ.

Халяль-совместимый

Единственный GPU-облако с сертификатом AFSA/МФЦА. Структура Мудараба. Доступ к $4.5 трлн исламских суверенных фондов.

Developer-First API

Deploy GPUs in Seconds

Full REST API, Python SDK, Node.js SDK, and CLI. Spin up NVIDIA Rubin R100 NVL72 instances or call Groq LPX inference with a single command.

Get API Key

Launch Instance

Choose GPU type, count, and container image

Train or Infer

SSH in for training, or use Groq API for <10ms inference

import qube

client = qube.Client(api_key="your-api-key")

# Launch a GPU instance
instance = client.instances.create(
    gpu_type="rubin-r100-nvl72",
    gpu_count=8,
    image="nvidia/pytorch:24.04",
    region="almaty-sez"
)

print(f"Instance {instance.id} is {instance.status}")
print(f"SSH: ssh root@{instance.ip}")

# Run inference with Groq LPX
response = client.inference.create(
    model="llama-3.1-70b",
    messages=[{"role": "user", "content": "Hello!"}],
    max_tokens=512
)
print(response.choices[0].message.content)
# Latency: 8ms

api.qubecompute.com

SDK Access: Private Beta for LOI Signatories

Пять неоспоримых преимуществ

Ни один облачный провайдер не сочетает эти сильные стороны

months monopoly

First Rubin R100 NVL72 Cloud Provider

No NVL72 in KZ, UZ, KG. Nearest competitor with Rubin — Finland (Nebius), UAE (G42). 18-24 month exclusive window.

/kWh

3x Cheaper Energy

Gas-powered generation at $0.048/kWh vs $0.09-0.18 at Western competitors. ABHM absorption cooling, PUE 1.10.

addressable market

Only Sharia-Compliant GPU Cloud

AFSA/AIFC certified Mudaraba structure. Access to PIF ($925B), QIA ($475B), ADIA ($993B) sovereign wealth funds.

taxes until 2029

SEZ Tax Exemptions

0% corporate tax, VAT, personal income tax in SEZ PIT Alatau. Government investment contract guarantees.

ms latency

Groq LPX Real-Time Inference

Sub-10ms LLM inference API globally. Unique Rubin + Groq combination for training + real-time serving.

Performance

Benchmark Comparisons

NVIDIA Rubin R100 NVL72 delivers up to 5x more performance per dollar compared to H100. Combined with Groq LPX for inference — unmatched speed and efficiency.

LLaMA 3.1 70B Training

Time to train (1T tokens)

Rubin R100 NVL72~3 days

H100 SXM (8×)~15 days

A100 SXM (8×)~38 days

Inference Throughput

Tokens/sec (LLaMA 70B)

Groq LPX~3,000 tok/s

Rubin R100~800 tok/s

H100 TensorRT~350 tok/s

A100~120 tok/s

Memory Bandwidth

Per rack

Rubin R100 NVL72468 TB/s

GB200 NVL72~380 TB/s

H100 SXM (8×)26.4 TB/s

FP4 Performance

Per rack

Rubin R100 NVL721,400+ ExaFLOPS

GB200 NVL72~720 ExaFLOPS

H100 SXM (8×)~16 ExaFLOPS

* Benchmark estimates based on NVIDIA published specifications and industry testing. Actual performance may vary by workload. Rubin R100 NVL72 specs from NVIDIA GTC 2025 announcements.

Экономия до 70%

Посмотрите сколько вы сэкономите

Сравните Qube Compute с крупными GPU-облачными провайдерами. Rubin R100 + дешёвая энергия = непревзойдённая экономика.

Количество GPU8 GPUs

172 (full rack)

Часов в день24h/day

1h24h

Провайдер	GPU	$/GPU/час	Стоимость/мес	Стоимость/год	Экономия
Qube ComputeЛучшая цена	Rubin R100	$14	$80,640	$967,680	—
AWS (p5.48xlarge)	H100	$163.85 ($32.77 x 5hrs)	$943,776	$11,325,312	91% $10,357,632/yr
Azure (ND H100 v5)	H100	$136.00 ($27.20 x 5hrs)	$783,360	$9,400,320	90% $8,432,640/yr
GCP (a3-highgpu-8g)	H100	$156.10 ($31.22 x 5hrs)	$899,136	$10,789,632	91% $9,821,952/yr
CoreWeave	H100	$23.80 ($4.76 x 5hrs)	$137,088	$1,645,056	41% $677,376/yr
Lambda Cloud	H100	$17.45 ($3.49 x 5hrs)	$100,512	$1,206,144	20% $238,464/yr

* Qube Compute использует якорные цены ($14/GPU-пакет/ч). Цены конкурентов из публичных прайс-листов 2025 г.

Готовы экономить в 3 раза на GPU?

Клиентская воронка

Корпоративный спрос уже формируется

Активные LOI и переговоры с предприятиями в 4 секторах. Ёмкость Фазы 1 (8 стоек) распределяется между якорными клиентами.

LOI в воронке

576+

GPU запрошено

$8M+

Годовая стоимость контрактов

Отраслевых секторов

Активная клиентская воронка (имена под NDA)

Сектор	Регион	Применение	Ёмкость GPU	Статус
Финансовые услуги	Ближний Восток	Антифрод ML, кредитный скоринг	Несколько стоек	LOI в процессе
Энергетика и промышленность	Евразия	Предиктивная аналитика, оптимизация	Выделенная стойка	LOI в процессе
Государство и госсектор	Евразия	Национальная AI-платформа, NLP	Мульти-стоечный кластер	На обсуждении
Здравоохранение и биотех	Ближний Восток	Разработка лекарств, диагностика	Выделенная стойка	На обсуждении

Имена клиентов защищены NDA. Подробности доступны по запросу инвесторов под NDA.

AI-решения для каждой отрасли

Инфраструктура, созданная для самых требовательных задач

Oil & Gas AI

Seismic analysis, predictive maintenance, and well optimization for KMG, TCO, Karachaganak.

Financial AI

Anti-fraud ML, algorithmic trading signals, and risk scoring for banks and fintech.

Government AI

National digitalization projects, NLP for public services, and smart city infrastructure.

Healthcare AI

Real-time diagnostics, drug discovery, and molecular dynamics on Groq LPX under 10ms.

Технологические партнёры и экосистема

Построено на партнёрствах с мировыми лидерами AI-инфраструктуры, финансов и комплаенса

NVIDIA

GPU Partner

Groq

Inference Partner

AIFC

Legal Framework

Al Hilal Bank

Escrow Partner

ComplyAdvantage

KYC/AML

Astana Hub

Tech Ecosystem

Built for Every Industry

Serving enterprises globally — from AI startups to Fortune 500

AI Startups

Fortune 500

Sovereign Wealth Funds

Fintech

Healthcare AI

Oil & Gas

Research Labs

Government AI

Готовы масштабировать ваш AI?

Ограниченная ёмкость Фазы 1 — 8 стоек. Бронируйте сейчас по якорным ценам.

Доступ к GPU с июля 2027. Бронируйте сейчас для якорных цен.

Забронировать GPU Запросить инвестиционные материалы