Najvýkonnejšie servery Najvýkonnejšie servery
Na trhu GPU sa objavil nový favorit, ktorý prepisuje pravidlá hry. NVIDIA RTX PRO 6000 Blackwell ukazuje, že éra dominancie datacentrových kariet H100 NVL nemusí trvať večne. V testoch s veľkými jazykovými modelmi (LLM) dokázala, že si poradí aj s obrím gpt-oss 120B - modelom vyžadujúcím 96 GB VRAM - a to bez robenia, kompromisov alebo potreby zložitej infraštruktúry.

Výkon pri inferencii

Rýchlosť inferencie je kľúčovým faktorom pre praktické využitie veľkých jazykových modelov (LLM). Určuje, ako rýchlo GPU dokáže spracovať vstupný dotaz a vygenerovať odpoveď.

V testoch spracovania vstupu (promptu), dôležitom napríklad pre RAG – retrieval-augmented generation, dosiahla H100 výkon 575,5 tokenov/s. RTX PRO 6000 však překvapivo získala náskok s 776,2 tokeny/s, teda o 35 % vyššiu rýchlosť. Odchylka v oboch prípadoch činila približne ± 10 %.

Pri samotnom generovaní výstupu sa rozdiel ešte zväčšuje: PRO 6000 dosahuje 108,9 ± 4,3 tokenov/s, zatiaľ čo H100 len 68,75 ± 1,64 tokenov/s - teda až o 58 % rychlejší výstup.

Testovacie prostredie

Testy prebiehali s modelom gpt-oss: 120B (f7f8e2f8f4e0) z knižnice Ollama, spustené v OpenWebUI v0.6.18 a Ollama 0.11.2.

Každé meranie prebiehalo na samostatnej inštalácií bez paralelného zaťaženia, takže výsledky presne odrážajú výkon jedného GPU v reálných podmienkach.

Cena a prevádzková efektivita

Rozdiel medzi oboma kartami je priepastný aj finančne. NVIDIA H100 NVL vychádza zhruba na 40 tisíc €, takže ide o riešenie určené prevažne pre rozsiahle datacentrové projekty.

Oproti tomu RTX PRO 6000 Blackwell stojí približne 10 000 € – takže štyrykrát menej. Navyše je možné si ju prenajať priamo u nás na ZonerCloud.sk len za 599 € mesačne, čo otvára cestu aj menším tímom alebo jednotlivcom.

Spotreba PRO 6000 dosahuje až 600 W, zatiaľ čo H100 NVL sa pohybuje medzi 350–400 W. Vďaka tomu, že PRO 6000 zvládne celý model držať v pamäti, odpadáva nutnosť multi-GPU clusterov aj zložitého sieťového prepojenia, čo významne znižuje náklady.

GPU Zriaďovacia cena Pomer cena/H100 Možnosť prenájmu Spotreba
H100 NVL cca 40 000 € nie je bežne dostupné pre menšie tímy 350–400 W
RTX PRO 6000 Blackwell cca 10 000 € 0,25× (4× lacnejšie) ZonerCloud: 599 €/mesiac až 600 W

Technické parametre RTX PRO 6000 Blackwell

Parameter Hodnota
Architektúra NVIDIA Blackwell
Pamäť 96 GB GDDR7 ECC
Šírka zbernice 512 bit
Priepustnosť pamäte ~1,8 TB/s
CUDA jadra 24 064
Tensor jadra 5. generácia (752 jednotiek)
RT jádra 4. generácia (188 jednotiek)
Výkon FP32 ~125 TFLOPS
Výkon AI/TOPS až 4 000 TOPS
Rozhranie PCIe Gen 5 x16
Spotreba (max) 600 W
Podpora MIG/delenie 1×96 GB, 2×48 GB, 4×24 GB

Vďaka tejto konfigurácií dokáže karta pojať celý model gpt-oss 120B v jednom GPU bez nutnosti swapovania alebo rozdelovania dát.

Priame porovnanie H100 vs. PRO 6000

Aspekt PRO 6000 Blackwell H100 NVL
Pamäť 96 GB 94 GB HBM3
Priepustnosť pamäte ~1,8 TB/s ~3,9 TB/s
Výkon AI/TOPS 4 000 ~3 341
Spotreba až 600 W 350-400 W
Efektivita na watt nižšia vyššia
Infraštruktúrne nároky nízke, pracovné stanice vysoké, datacentrum
Držanie modelu ≥96 GB áno môže byť limitujúce
Komplexita clusteru ľahké vyššie

Z tabulky je jasné, že H100 má sice výhodu v efektivite a priepustnosti pamäte, ale RTX PRO 6000 víťazí v praktickosti – celý model zvládne v jedinom GPU bez nutnosti zložitej infraštruktúry.

Finálne zhrnutie

NVIDIA RTX PRO 6000 Blackwell je novým lídrom pre beh a tréning rozsiahlych LLM modelov. Vďaka 96 GB VRAM udrží kompletný model v jednej karte, čo zjednodušuje nasadenie, zrýchluje odozvu a znižuje riziko chýb.

Oproti H100 NVL ponúka vyššiu rýchlosť inferencie, rychlejšie generovanie výstupu, nižšie zriaďovacie náklady a možnosť flexibilného prenájmu. H100 zostáva voľbou pre masivne datacentrá, ale pre praktické nasadenie LLM je PRO 6000 jasným favoritom – a navyše cenovo dostupným.

vyskúšajte si výkon Blackwell v praxi

Pokiaľ hľadáte najrýchlejší a najdostupnejší spôsob, ako spustiť veľké LLM modely, vyskúšajte RTX PRO 6000 na ZonerCloud.sk. Získate prístup k najmodernejším GPU priamo v Česku, s minimálnou latenciou a bez nutnosti vlastného datacentra.

Žiadne vysoké vstupné náklady, žiadne zložité nastavenia. Iba čistý výkon pripravený okamžite pre vaše projekty s umelou inteligenciou.