Nvidia uvádí procesor Grace CPU Superchip. 144 jader, 1TB/s RAM

Nvidia chce do světa procesorů ARM vstoupit opravdu ve velkém

V úterý na konferenci GTC 2022 představila Nvidia novou architekturu GPU Hopper a na ní založené 4nm akcelerátory H100 pro AI úlohy a servery. Ale nebylo to jediné, co firma prezentovala. Současně oznámila také své první výkonné procesory s kódovým označením Grace, kterým také říká „Grace CPU Superchip“. Má jít o procesor konkurující ve výkonu těm nejrychlejším Xeonům a Epycům, dost se ale také podobá M1 Ultra od Apple.

Grace CPU Superchip

Nvidia již plány na procesor Grace předběžně představila loni, ale tehdy ještě jen s málo detaily. Teď začíná tzv. „superčip“ nabírat konkrétnější obrysy. A jsou to obrysy dvojité. Ne však proto, že by se někde pila zelená – Grace totiž zdá se bude procesor složený ze dvou kusů křemíku. Každý má obsahovat 72 jader ARM, takže celkový procesor bude mít 144 jader a 396 MB cache (patrně je to součet L2 + L3, není jasné, zda třeba nejsou zahrnuté i kapacity L1). Každý z čipů bude mít konektivitu NVLink, která je zároveň použitá k propojení obou čipů k sobě.

Tato koncepce je podobná tomu, jak AMD tvořilo serverové Epycy 7001 nebo Threadrippery 1. generace (a předtím Opterony 6100/6200/6300). Do určité míry se jedná o dvě CPU (2S systém) v jednom. Jeden čip bude schopen fungovat i samostatně coby 72jádro. Zatím nebylo sděleno, jaký výrobní proce Nvidia použije, možná by mohlo jít o stejný 4nm proces TSMC, jako u GPU Hopper.

Nvidia Grace CPU Superchip (Zdroj: Nvidia)

Grace bude používat architekturu jader CPU zřejmě licencovanou od ARMu, mělo by patrně jít o nějaké jádro ARM Neoverse. Možná Neoverse N2, možná nějaké novější nebo výkonnější, například zatím neoznámená Neoverse V2. Každopádně má již mít instrukční sadu ARMv9 (a tím pádem také instrukce SVE/SVE2).

Od ARMu možná také bude licencovaná interní propojovací logika, ovšem pro vnější komunikace bude (super) čip mít konektivitu NVLink od Nvidie. Asi to není třeba připomínat, ale Nvidia se s ARMem plánovala přímo spojit, tato akvizice ale nakonec selhala. Plány Nvidie nejspíš proto počítaly se silným propojením s technologiemi ARMu. Nicméně i bez fúze/akvizice je může snadno používat pod licencí, takže toto by neměl být velký problém.

Dvě poloviny Nvidia Grace CPU Superchip propojené pomocí rozhraní NVLink (Zdroj: Nvidia)

Grace Hopper Superchip: kombo CPU+GPU v jednom

Kapacita propojení NVLink mezi dvěma čipy ve 144jádrovém „Grace CPU Superchip“ má být 900 GB/s, což odpovídá 18 linkám NVLink 4. Stejný počet poskytuje také nové GPU Nvidia H100 (čip GH100). A firma toto také bude využívat.

Vedle „Grace CPU Superchip“ má existovat také „Grace Hopper Superchip“, kde bude použitý jeden CPU čip Grace se 72 jádry a k němu se přes onu 900GB/s konektivitu NVLink připojí čip GH100 architektury Hopper. Toto bude vyvedené v jednom modulu tvořícím kompletní systém s hostitelským CPU a pamětí a akcelerátorem.

Nvidia Grace Hopper Superchip (Zdroj: Nvidia)

Superširoké paměti LPDDR5X

Procesorový čip Grace bude mít tu zvláštnost, že nebude používat klasické paměti DDR5 ve slotech. Stejně jako Apple u svých procesorů se Nvidia chce spolehnout na mobilní paměti typu LPDDR, zde by to měla být LPDDR5X. Tyto paměti mají velmi nízkou spotřebu, ale lze jimi vytvořit velkou propustnost, pokud jich osadíte velmi mnoho do značně širokého paměťového řadiče. Apple například má u procesorů M1 Max 512bitový řadič s propustností 400 GB/s a u M1 Ultra 1024bitový s propustností 800 GB/s. Při takovémto použití se z LPDDR5/5X stává levnější a úspornější náhrada pamětí GDDR nebo i typu HBM.

Dvoučipový Grace CPU Superchip má podle Nvidie mít propustnost okolo 1 TB/s, zatímco poloviční jednočipová verze (tedy CPU část v Grace Hopper Superchipu) by tedy asi měla mít propustnost 512 GB/s. Obě poloviny mají totiž pravděpodobně v sobě polovinu z celkového počtu paměťových kanálů. Nvidia tedy asi u jednoho čipu použije dvakrát tak široký paměťový řadič, jako Apple u M1 Max – 1024 bitů. To je ekvivalent šířky 16kanálového paměťového řadiče u DDR4. Dvojčipová verze Grace CPU Superchip je tedy něco jako procesor s 32kanálovými pamětmi.

Nevýhoda LPDDR je ale, že paměť bude muset být osazená napevno. Jeden čip bude mít nejspíš maximální kapacitu paměti 512 GB, protože Nvidia ve svém marketingu naznačila, že Grace Hopper SuperChip bude mít „600 GB“ paměti – což asi znamená, že jednočipové Grace dodá 512GB RAM a GPU H100 pak k tomu 80 GB grafické paměti. Dvojčipová verze Grace CPU Superchip by ale tudíž dohromady mohla mít kapacitu až 1 TB.

Procesor Nvidia Grace umožňuje další pružné konfigurace s více GPU (Zdroj: Nvidia)

Paměti budou podporovat ECC, ale je možné, že to bude in-band ECC, které potřebuje nějakou část kapacity. Na druhou stranu počet kanálů je tak vysoký, že by Nvidia jednoduše mohla část čipů používat pro redundanci, takže by nakonec šířka řadiče nebyla 1024 bitů, ale fyzicky 1152 (jedna osmina navíc). Na vizualizacích modulu s procesorem Grace je ale vidět osm, nikoliv devět pouzder s pamětí, což by spíše ukazovalo spíš na in-band ECC.

Údajně top výkon, ale vydání až za rok

Podle Nvidie bude Grace CPU Superchip – tedy verze se 144 jádry – po svém vydání nejvýkonnější, nebo přinejmenším jeden z nejvýkonnějších procesorů pro servery. Jeho mnohovláknový výkon ve SPECrate2017_int_base má přesahovat 740 bodů. Podle Nvidie má Grace CPU Superchip mít víc než o 50 % vyšší výkon než dvojice 64bitových Epyců 7742, která má dosahovat 460 bodů (to je ještě generace s architekturou Zen 2, kterou Nvidia používá v serverech DGX A100).

Podle Nvidie bude Grace CPU Superchip „nejvýkonnější procesor na trhu“ v „široké škále aplikací“ jako jsou hyperscale úlohy, analýza dat a vědecké výpočty. To nemusí znamenat, že půjde o celkově nejrychlejší serverový procesor. Může asi podobně jako dnešní implementace serverových procesorů ARM Neoverse (například Ampere Altra Max) mít primát jen v menší části datacentrových úloh.

Háček je tu v onom „až přijde na trh“. Nvidia totiž sice oznámila tento procesor teď, ale dostupný má být až v první polovině roku 2023. Tedy až plus minus za rok. V té době už by měla také konkurence mít na trhu výkonnější procesory než dnes – Intel čipletové Sapphire Rapids a AMD už nejen Zen 3 a teď nový Zen 3 s 3D V-Cache, ale asi už také Epyc 7004 Genoa s architekturou Zen 4. Ve srovnání s nimi už nemusí Grace CPU Superchip vypadat tolik super jako teď rok před vydáním, byť pomalý nebo slabý ve své době rozhodně nebude.

Zdroje: Nvidia, ServeTheHome, Tom’s Hardware

Jan Olšan, redaktor Cnews.cz

⠀

Back to: Nvidia chce do světa procesorů ARM vstoupit opravdu ve velkém

Flattr this!

the patient on Nvidia v generaci Blackwell zase chystá grafiku Titan… pro AI?V Bratislavě jenom některé, bohužel. Měli byste s tím něco dělat, Bufo 🙂
Jmeno on Trpí degradací čipů Raptor Lake i mobilní procesory Intel?Tohle je bomba : it appears that at least all 65 W or higher base...
Bufo on Nvidia v generaci Blackwell zase chystá grafiku Titan… pro AI?A není to málo Antone Pavloviči? Nebylo by lepší již na východ od Břeclavi?
the patient on Nvidia v generaci Blackwell zase chystá grafiku Titan… pro AI?Bude na tom trénovat největší konzervativní jazykový model, kterým plánuje nahradit všechny slovenské politiky na...
Roob on Nvidia v generaci Blackwell zase chystá grafiku Titan… pro AI?https://pctuning.cz/article/elon-musk-pohani-nejrychlejsi-datove-centrum-ai-generatory-v-navesech tu je dalsi, co nakupil, ale co ponuka?? Aka sluzba mu na tom pojde,...
the patient on Nvidia v generaci Blackwell zase chystá grafiku Titan… pro AI?@bufo Neměl jsem v úmyslu poodkrývat politické preference, myslím, že to vyznívá docela neutrálně. I...
Bufo on Nvidia v generaci Blackwell zase chystá grafiku Titan… pro AI?@ the patient Si vymenoval "brilantné" politické osobnosti (inak Mr. Presidents of Hungary and Russia...
the patient on Nvidia v generaci Blackwell zase chystá grafiku Titan… pro AI?Máš pravdu, tahle nejistota by jistě povzbudila Muska a Petersona vyvodit mnoho pozoruhodných závěrů. Fico...
Bufo on Nvidia v generaci Blackwell zase chystá grafiku Titan… pro AI?Rozmýšľam (keď už sedím na tom záchode :D ), že ako by sa pri mechanickom/robotickom...

Nvidia uvádí procesor Grace CPU Superchip. 144 jader, 1TB/s RAM