O 50% lepší než x86? Nvidia uvádí procesor Vera s jádry Olympus

Nvidia tento týden pořádala konferenci GTC. Pro hráče a trh PC z ní bylo nejdůležitější odhalení kontroverzního AI filtru DLSS 5, zatímco už opravdu dlouho vyhlížené Arm procesory N1 a N1X pro počítače a notebooky zase nikde k vidění nebyly. Nvidia ale uvedla jiné CPU – procesor Vera pro servery. O tom mluví už dlouho a před časem oznámila, že ho bude prodávat i samostatně (mimo své vlastní servery). Nyní oficiálně přichází na trh.

Procesor Vera (svým názvem naznačující kombinaci s AI akcelerátory Rubin) není úplně přelomový, protože Nvidia už předtím uvedla vlastní procesory Grace, které však používaly licenční architekturu Neoverse-V2.

Zásadní je Vera tím, že se v něm Nvidia vrací k vlastní architektuře jádra CPU (kterou zkoušela v minulé dekádě, ale neúspěšně), takže přebírá do vlastních rukou nejdůležitější aspekty tohoto procesoru. A firma by ho chtěla už nejenom přibalovat ke GPU ve svých serverech, ale sebrat s ním část širšího datacentrového trhu Intelu, AMD a případně dalším Arm procesorům.

Vlastní jádro s SMT

Procesor Vera je založený na jádrech, kterým Nvidia říká Olympus, patrně stále propojených mesh sběrnicí – má jít o druhou generaci logiky Nvidia SCF (Scalable Coherency Fabric). Jader je v procesoru 88 a celkově pro ně propojovací logiky poskytuje 162 MB L3 cache. Podle ilustrace či snímku čipu by v křemíku mohlo asi fyzicky být jader víc, snad 91, vypadá to totiž, že mesh uspořádání má 7 sloupců se 13 jádry v každém. Tři jádra by pak vždy byla vypnutá, což dovolí využít i zmetkové čipy.

Tato jádra implementují instrukční sadu ARM v9.2 včetně například instrukcí SVE2, ale Nvidia architektura by měla být čistě podle představ Nvidie. Firma toho o řešení jádra moc neříká, ale jedna velká odlišnost je zřejmá – zatímco Arm nepoužívá technologii SMT, jádro Olympus něco podobného má a jádro zpracovává dvě vlákna. Celkem má tedy Vera 176 vláken.

Nvidia Vera
Nvidia Vera

Zdá se ale, že technologie není tak pružná jako u Intelu a AMD – aktivace SMT staticky rozdělí všechny prostředky jádra, takže vždy snižuje výkon na 1 MHz, i když je druhé vlákno neaktivní. Zapnutí nebo vypnutí SMT lze údajně provést při bootu systému, za běhu ho nelze změnit. V architektuře pro osobní počítač by tedy toto SMT nebylo na rozdíl od serverů moc dobře využitelné.

Tato technika také nebude tak efektivní v extrahování maximálního potenciálu výpočetních prostředků v jádře. Je ale možné, že v budoucích architekturách Nvidia funkci zdokonalí. Nvidia ji označuje Spatial Multithreading, zatímco klasické pojetí SMT s flexibilní alokací jednotek znamená Simultaneous Multithreding.

Slajd k procesorům Nvidia Vera
Slajd k procesorům Nvidia Vera

Nvidia toho dále o jádrech říká relativně málo. Víme, že používají vedle zmíněné L3 cache také 2MB L2 cache privátní pro každé jádro (u Grace to byl jen 1 MB). Jádro má údajně podobně jako nejnovější architektury Armu a Applu údajně schopnost dekódovat 10 instrukcí za cyklus. Frontend má mít zdvojený prediktor větvení, tedy schopnost zpracovat dvě větvení za cyklus, nebo vyhradit jeden prediktor pro každé z vláken při použití SMT.

Jádra by měla mít poměrně dobrý hrubý výkon v SIMD výpočtech – Nvidia podobně jako Arm u jádra Cortex-X925 nasadila šest pipeline se 128bitovou šířkou. Ač tedy procesor podporuje instrukce SVE2 (mezi nimiž jsou i operace s hodnotami FP8 pro AI kód), nevyužívá jejich možnost práce s většími šířkami vektorů. Procesory x86 tedy budou mít v hrubém výpočetním výkonu pořád hodně velkou výhodu díky 512bitovým jednotkám AVX-512.

Součet všech vykonávacích jednotek v backendu, tedy ALU, jednotek pro větvení a SIMD/FPU pipeline, ale zřejmě mimo AGU a load/store jednotek, prý má být minimálně 14. Takže vedle 6 SIMD pipeline by to mohlo být 8 ALU – kvůli SMT asi jednotky budou vždy v sudých počtech. Výkon na 1 MHz („IPC“) má být o 50% vyšší než u jádra Neoverse-V2 v Grace – ale nevíme, zda je to včetně SMT.

Čiplety

Procesor je disagregovaný do více čipletů. Jádra jsou na jednom centrálním kusu křemíku. Vedle něj je po stranách osm malých čipletů s paměťovými řadiči – Vera má velmi široké paměťové rozhraní o šířce 1024 bitů (ekvivalent 16kanálových pamětí v tradiční terminologii) a opět používá paměti typu LPDDR, čímž se vymyká z klasické koncepce serverů. Propustnost RAM má být 1,2 TB/s (což by implikovalo, že je použitá paměť LPDDR5X-9600) a kapacita až 1,5 TB. Osazuje se v modulech SOCAMM, kapacitu lze tedy měnit podle libosti.

Nvidia Vera
Nvidia Vera

Dále je k centrálnímu čipletu přilepený čiplet s konektivitou NVLink-C2C, která slouží k propojení s dalším procesory nebo s GPU. Její propustnost může být až 1,8 TB/s. Oproti němu je pak větší System I/O čiplet, který implementuje různé řídící a doplňkové funkce a bloky, které jsou potřeba k vytvoření plnohodnotného SoC, ale také obsahuje řadiče PCI Expressu 6.0. Ty alternativně podporují také koherentní konektivitu CXL 3.1.

Spotřeba neznámá

Firma zatím nesdělila frekvence, cenu ani TDP. V prodeji prý má být jen jedna konfigurace s 88 jádry, bez nějaké větší variability modelů. Podle Nvidie má výkon procesoru být až 1,5× lepší než nejmenovaného konkurenčního x86 CPU pro servery v Nvidií definovaných AI úlohách a prý jsou až dvakrát energeticky efektivnější než „jakékoli ostatní procesory“.

Jde samozřejmě o oficiální benchmarky, které mohou být silně selektivní a různě přikrášlené. Nvidia dala vedle toho také předběžný přístup k procesoru firmě Red Panda, která provedla nějaké další testy proti procesorům Epyc 9004 a 9005. Ale i tyto jsou asi aspoň částečně marketingového charakteru a přibližují jen některé typy úloh – nejde o nezávislý test.

Oficiální benchmarky procesoru Vera proti předchozí generaci Grace
Oficiální benchmarky procesoru Vera proti předchozí generaci Grace

Nvidia bude procesory Vera používat v rackových systémech NVL72 s GPU Rubin, ale bude je nabízet v rackových systémech s 1U servery, s až 8 procesory na jeden 1U server, v celém racku má být 256 procesorů Vera, což bude vyžadovat chlazení vodou.

Kromě Nvidie ale má servery či desky pro ně údajně nabízet i víc dalších výrobců (mezi nimi Dell, HPE, Supermicro, Lenovo), takže servery s procesorem Vera nebudou exkluzivní produkt jen Nvidie.

Dostupnost až v druhé polovině roku

Jak to už u Nvidie chodí, ačkoliv minulý týden na GTC byl procesor Vera oficiálně vydán, je to stále převážně papírové uvedení. Zákazníci teď totiž asi stále mají jenom vzorky. Dostupnost sériových procesorů má totiž nastat až v druhé polovině roku.

Zdroje: ServeTheHome, Nvidia (12), Tom’s Hardware (1, 2)

Jan Olšan, redaktor Cnews.cz


Contents

Nuvia 2? Elitní architekti z Applu opět vyvíjí vlastní procesor

Jak známo, procesory Qualcomm Snapdradon X Elite i jejich druhá generace X2, která nyní přišla na trh, vděčí za svůj vznik stejným architektům CPU, kteří v Applu navrhovali oceňované čipy jako M1, než se „trhli“ a založili si startup Nuvia s cílem vyvinout podobně výkonná jádra Arm. Qualcomm Nuvii koupil, ale nedávno ho dva hlavní aktéři opustili. Teď se možná celá sága zopakuje, protože spouští novou firmu a opět libují revoluční procesory. Celý článok „Nuvia 2? Elitní architekti z Applu opět vyvíjí vlastní procesor“ »

Contents

Snapdragon X2 Elite v prodeji: Arm notebooky jsou teď nejrychlejší

Qualcomm oznámil procesory Snapdragon X2 Elite pro notebooky s Arm Windows založené na nové generaci architektury Oryon už na podzim, ale tentokrát čekání na jejich reálné vydání nebude tak dlouhé jako u minulé generace. První notebooky s těmito procesory se právě začaly prodávat současně s vydáním recenzí. Zdá se, že Qualcomm víceméně naplnil to co slíbil a tyto procesory jsou teď nejvýkonnější CPU pro notebooky s Windows na trhu. Celý článok „Snapdragon X2 Elite v prodeji: Arm notebooky jsou teď nejrychlejší“ »

Contents

Raspberry Pi opět drasticky zdražují, jen po dvou měsících

Jsou to jen dva měsíce, co kvůli extrémnímu zvýšení cen pamětí musely zdražit minipočítače Raspberry Pi, což ovšem nebylo poprvé. A ani naposled, teď totiž přichází další zvýšení jejich cen jdoucí napříč modely. Bohužel je opět drastické a RPi tím nejspíš ztratí smysl pro značnou část uživatelů. Firma kvůli cenám paměti také vydala nový kompromisní model s 3GB pamětí, který má být jakousi náplastí na vysoké ceny 4GB verze. Celý článok „Raspberry Pi opět drasticky zdražují, jen po dvou měsících“ »

Contents

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *