Site icon HWCooling.net

Zen 4 s 3D V-Cache do superpočítačů. Epyc Genoa-X má 1,1GB cache

Epyc 9004X: kombinace Zenu 4 a 3D V-Cache pro HPC a technické výpočty

AMD tento týden vypustilo do světa procesory Epyc 9704 „Bergamo“ se 128 jádry Zen 4c a také oznámilo GPU akcelerátor Instinct MI300X pro umělou inteligenci. Spolu s tím vyšla ještě jedna novinka pro nejnáročnější výpočetní aplikace: serverové procesory generace Zen 4 s 3D V-Cache. Ty aplikují technologii z Ryzenů 7000X3D na základ Epycu 9004 Genoa s až 96 jádry, čímž vzniká asi vůbec nejnabušenější CPU pro náročné úlohy, jaké dnes existuje.

Tyto procesory budou značené také Epyc 9004 jako standardní modely s architekturou Zen 4, ale navíc budou v názvu mít písmeno X na konci, takže se tato rodina také označuje jako „Genoa-X“. Jde o specializovaná CPU určená pro stejné role jako předchozí generace Milan-X (Epyc 7003X) založená na architektuře Zen 3. Jejich hlavní funkcí budou technické výpočty, ale význam budou mít i pro superpočítače a obecně sektor HPC.

Rodiny procesorů Epyc generace Zen 4

Procesory Genoa-X používají stejný socket SP5 s až 12kanálovými pamětmi DDR5-4800 a 128 linkami PCI Express 5.0 jako běžné Epycy 9004. Měly by být kompatibilní se všemi deskami a servery, jen se bude muset aktualizovat firmware. CPU používá stejný centrální IO čiplet, ale liší se CPU čiplety. Na těch je totiž skrze TSV metodou 3D pouzdření přidána tzv. V-Cache v kapacitě 64 MB, která se přidá ke kapacitě L3 cache již existující v CPU čipletu.

Stejně jako u Zenu 3 to funguje tak, že výsledný blok L3 cache je unifikovaný a tvoří souvislou 96MB kapacitu, která je přidružená k osmi jádrům Zen 4 v bloku CCX (a CPU čipletu) a dodává jim velmi vysokou propustnost pro ta data, která se do cache vejdou. Celkové množství L3 cache v CPU pak závisí na tom, kolik CPU čipletů procesor obsahuje, vždy jde ale o kapacitu distribuovanou v jednotlivých 96MB blocích. Jádra z jiných CPU čipletů nemají do bloku cache lokalizovaném v konkrétním čipletu přímý přístup, musí do ní přistupovat přes propojovací logiku Infinity Fabric.

AMD Epyc 9004X Genoa-X

96jádro a dva modely pro úlohy s nízkým počtem vláken

AMD zatím oznámilo tři modely těchto procesorů. Hlavním je nejvýkonnější plně aktivní verze Epyc 9684X, která ukazuje plný potenciál technologie. Má 96 jader a 192 vláken na frekvenci 2,55 GHz v základu a až 3,70 GHz v boostu, TDP je 400 W. Díky použití všech 12 CPU čipletů má procesor celkem 1152 MB L3 cache – jeden celý a jednu osminu gigabajtu (stále je to však rozděleno v 12 blocích po 96 MB). Je to také zřejmě vůbec nejdražší procesor od AMD – jeho oficiální cena je 14 756 $ (u nás s DPH je to 388 tisíc Kč / 16 300 €).

Druhé dva modely jsou výrazně „menší“ co do počtu jader. AMD nevydalo žádné 64jádro nebo podobný mezistupeň, další dva modely jsou místo toho už zaměřené evidentně na jednovláknový výkon, jsou zřejmě obdobou modelů Epyc 9004F, ale s přidanou cache.

Modely procesorů Genoa-X

Epyc 9384X má 32 jader a 64 vláken na základním taktu 3,10 GHz a s maximálním boostem 3,90 GHz. Je však složený z osmi CPU čipletů (kde v každém je aktivní jen polovina jader), takže celkově pořád nese 768 MB L3 cache. TDP tohoto modelu je 320 W a stojí 5529 $.

Ještě vyhraněnější tímto směrem je poslední model Epyc 9184X. Ten má jen 16 jader a 32 vláken, ale pořád je tvořen osmi CPU čiplety. V každém tedy budou aktivní jen dvě jádra z osmi, ale pořád je zachována kapacita L3 cache 768 MB. Tento procesor má takt 3,55 GHz v základu a 4,20 GHz v maximálním boostu. TDP je pořád 320 W, cena pak „jen“ 4928 $.

Použití osmi CPU čipletů (a osmi cache čipletů) navíc znamená, že výrobní náklady u těchto dvou modelů nebudou zrovna malé přes nízký počet jader. I marže je na procesorech, jako je Genoa-X, ale logicky dost vysoká.

Oficiální benchmarky?

V oněch technických výpočtech jako OpenFOAM, Ansys (CFX, LS-Dyna, Fluent) dosahuje Genoa-X podle AMD výkonu vyššího až o 120–190 % proti konkurenčnímu Intelu, pokud se porovnává 96jádro Epyc 9684X s nejvýkonnějším Xeonem „Sapphire Rapids“ s 60 jádry (model Xeon Platinum 8490H). I při stejném počtu jader, když se srovnávají 32jádra (Epyc 9384X a Xeon Platinum 8462Y), má Genoa-X mít podle AMD náskok 80–100 %.

Oficiální benchmarky Genoa-X od AMD

Je ale třeba upozornit, že nejde o srovnání s procesory Sapphire Rapids opatřeným 64GB pamětí HBM2E, které Intel vydal jako konkurenci těmto Epycům s 3D V-Cache (to by bylo 56jádro Xeon Max 9480 nebo 32jádro Xeon Max 9462). Takové procesory by si asi vedly lépe a přinejmenším by rozdíly byly menší. Obecně platí, že takovéto marketingové oficiální benchmarky mohou být různě zkreslené či selektivní, takže s hodnocením je třeba si počkat na nezávislé reálné testy.

Dostupnost hned

Vydání má být podle AMD „hard launch“ a tyto procesory jsou již dostupné na trhu (minimálně tedy asi u prodejců serverů a dotyčných řešení, na volném trhu to může vypadat jinak).

Zdroje: AMD, AnandTech, ServeTheHome

Jan Olšan, redaktor Cnews.cz