Intel Xeon Scalable 5. generace vypuštěn
Minulý týden Intel reálně vydal 4nm notebookové procesory Meteor Lake, které mají hodně rozvinutou čipletovou stavbu. Současně s nimi Intel ale také vydává druhou generaci čipletových Xeonů označenou „Emerald Rapids“. Ta následuje velmi rychle po předchozí „Sapphire Rapids“ a spolu s různými zlepšeními a opravami také v čipletech trošku ubírá plyn, jelikož místo čtyř používá jen dva. Zřejmě se tím nezlepšily nejen náklady, ale i spotřeba.
Procesory Emerald Rapids, nyní vydané jako Xeon Scalable 5. generace, jsou svébytná nová generace, protože jde o nově navržené čipy, ale zároveň se trochu podobají refreshi, protože proti Sapphire Refresh zvyšují počet jader jen o málo (z 60 na 64), používají stejnou platformu se stejnou konektivitou, a dokonce i architektura jader CPU je podle Intelu zcela beze změn.
Dva čiplety místo čtyř
Cílem této generace asi bylo hlavně zjednodušit komplexitu procesorů Sapphire Rapids, tvořených čtyřmi čiplety (které nejsou identické, CPU se skládá ze dvou typů kvůli tomu, jak se k sobě dlaždice skládají). Že je Sapphire Rapids příliš složitý produkt, možná dokládá i dlouhé (a několikrát nastavované) zpoždění, jakož i to, že Intel potřeboval nebývalé množství revizí, aby je konečně mohl komerčně vydat. A například funkcionalita CXL stále nebyla kompletně funkční.
Emerald Rapids je složený ze dvou čipletů, kde každý obsahuje 32 jader. Zůstává použití socketu LGA 4677, osmikanálových pamětí DDR5-5600, PCI Expressu 5.0, CXL 1.1 a 7nm výrobního procesu Intel 7. Největší změnou je, že Intel výrazně zvětšil L3 cache. Plně aktivní model s 64 jádry obsahuje celkem 320 MB L3 cache, zatímco nejvyšší 60jádra Sapphire Rapids nesla 112,5 MB L3 cache. Blok L3 cache spojený s každým jádrem se zvětšil z 1,875 MB na 5 MB.
Právě velká L3 cache bude asi hlavním tahákem a přínosem této generace. V aplikacích, jejichž pracovní data nejsou moc velká a z L3 cache moc neprofitují, bude výkon asi bez větších změn (vzhledem ke stejné architektuře jader), naopak pokud paměťový subsystém na Sapphire Rapids byl brzdou, mohou se výsledky o dost zlepšit. Emerald Rapids má i další zlepšení, například podpora CXL 1.1 by už měla být kompletní a podporovat nejen Type 1 a 2, ale i Type 3 zařízení.
Intel uvádí, že chování turbo boostu bylo zdokonaleno a procesory by často měly být schopné běžet na vyšších frekvencích. Současně byla ovšem opět rozšířena stupnice podtaktování procesoru při provádění náročných instrukcí (což bylo zavedeno kvůli AVX/AVX2, poté AVX-512). Doteď měl procesor čtyři různé třídy náročnosti instrukcí (0, 1, 2, 3), které značily, jak moc tyto operace způsobují snížení frekvencí. Intel nyní vytvořil novou třídu 4 pro nejnáročnější („heavy“) instrukce AMX, které byly doteď ve třídě 3 s nejnáročnějšími operacemi AVX-512. V té teď zůstanou jen „AMX moderate“, což by mohlo znamenat, že se pro některé operace AVX-512 a AMX bude nyní procesor podtaktovávat o něco méně, než když byly v poslední kategorii.
Zjednodušení stavby CPU na dva čiplety omezilo počet křemíkových propojek mezi dlaždicemi a také komunikační provoz mezi jádry, který musí jít mimo lokální dlaždici. Ukazuje se, že propojení čipletů je i s technologií Foveros stále faktorem negativně ovlivňujícím spotřebu a energetickou efektivitu. Díky tomuto zjednodušení se totiž Intelu prý podařilo snížit klidovou spotřebu procesoru (která byla u Sapphire Rapids vysoká) až o 100 W.
Menší procesory jsou monolitické
Je dobré zmínit, že nový křemík Emerald Rapids by asi měl pohánět jen výkonnější z modelů. Už v generaci Sapphire Rapids (Xeon Scalable 4. generace) totiž Intel pro nižší modely navrhl separátní monolitický křemík s 32 jádry, tzv. MCC křemík. Ten se pravděpodobně bude nyní prodávat i v rámci generace Emerald Rapids (zřejmě tedy se starší nižší kapacitou L3 cache). Měl by přibýt i ještě menší křemík LCC s 20 jádry.
Podle Intelu v průměru procesory Emerald Rapids dosahují až o 21 % lepšího výkonu než generace Sapphire Rapids (v úlohách inference AI uvádí +42 %, v HPC až +40 %). Energetická efektivita má být až o 36 % lepší. Nicméně toto jsou oficiální marketingové benchmarky, pro realistické poměření výkonu je třeba se podívat na nezávislé recenze.
Modely
Procesory Emerald Rapids mají opět celkem košatou množinu modelů, k čemuž přispívají modely určené pro speciální určení a politika, kdy Intel různé specializované akcelerátory u části modelů deaktivuje. Nejvýkonnějším modelem v nabídce CPU pro obecné určení je Xeon Platinum 8592+ s 64 jádry, 128 vlákny, 320MB L3 cache. Jeho takt je v základu 1,9 GHz a maximální boost má 3,9 GHz, ale all-core turbo je jen 2,9 GHz. Stojí oficiálně 11 600 $ a má 350W TDP.
Pro cloudové zákazníky ovšem existuje verze 8592V se základním taktem 2,0 GHz a 330W TDP (takty boostu 3,9 GHz a all-core boostu 2,9 GHz jsou však stejné) za 10 995 $. Tento model má aktivní jen tři ze čtyř UPI linek a také z nějakého důvodu snižuje podporu RAM z DDR5-5600 na DDR5-4800.
Úplně nejvýkonnějším modelem by asi měl být Xeon Platinum 8593Q za 12 400 $, který je zaměřen na servery chlazené vodou a zvyšuje TDP na 385 W. Tato verze 64jádra/128vlákna má základní takt 2,2 GHz a all-core boost 3,0 GHz, ale maximální boost zůstává stále jenom 3,9 GHz.
Všechny modely můžete vidět v těchto tabulkách:
Zdroje: Intel, ServeTheHome, Tom’s Hardware
Jan Olšan, redaktor Cnews.cz
⠀