Parametry nových 5nm GPU Nvidie jsou venku
Minulý týden pronikli hackeři do infrastruktury Nvidie, přičemž ukradli údajně 1TB dat včetně zdrojových kódů a dat k čipům. Něco z nich už uniklo, například že následující architektura chystaná po GPU Hopper bude Blackwell. Teď se z ilegálně vypuštěných souborů už ale podařilo zjistit mnohem víc: specifikace blížících se GPU s novou herní architekturou Lovelace (nebo Ada?), které vyjdou na podzim jako GeForce RTX 4000.
Zvědavců, kteří se do hackery zveřejněných dat Nvidie pustili, asi bude víc. Na Twitteru se objevily specifikace například od těchto dvou uživatelů. Uvádějí počty bloků SM, což je základní stavební jednotka GPU od Nvidie. Pokud budeme předpokládat, že v jednom bloku SM bude nadále přítomných 128 shaderů jako v architektuře Ampere (podle současných drbů se asi Lovelace v tomto nezmění), lze z počtů SM odvodit přímo počet shaderů, stream procesorů či Cuda jader, jak jim Nvidia (poněkud nepřesně) říká.
Nejvýkonnější GeForce RTX 4000: až 18 tisíc Cuda jader
Nejvýkonnější Lovelace, čip AD102, má údajně mít 144 SM (nebo 72 bloků TPC, které jsou tvořeny dvěma SM). To znamená 18 432 shaderů v grafické kartě, která by měla tento čip v plné konfigurace. Zprvu nicméně Nvidia může uvést jen grafiky s částečně ořezanými čipy, kvůli výtěžnosti. Například GeForce RTX 4080 by mohla mít shaderů až o pár tisíc méně, zatímco třeba RTX 4090 či RTX 4080 Ti by se blížily plnému počtu.
Paměťová sběrnice tohoto GPU je prý 384bitová, takže v tomto se Nvidia bude držet svých tradičních doktrín. Jaké paměti budou osazené, zda GDDR6, GDDR6X, nebo dokonce nějaká nová GDDR6+, to ještě nevíme. Před nedávnem se objevily poměrně nepříjemné zprávy, že modely grafik založených na tomto čipu by mohly mít TDP až 450 W (RTX 4080), 600 W (RTX 4080 Ti) a dokonce 850 W (RTX 4090?), ale doufejme, že se to nenaplní.
Další čip v řadě AD103 by se zřejmě mohl lišit od úlohy, kterou hrál čip GA103, vydaný v generaci Ampere s více než ročním zpožděním a zřejmě zaměřený dost na notebooky. AD103 by možná mohl být spíš následník GA104, vyjde asi hned po AD102 a bude tvořit páteř populárních grafik vyššího mainstreamu.
Toto GPU má mít 84 bloků SM, tedy stejně, jako má teď highendový čip GA102. Znamená to 10 752 shaderů při plné konfiguraci. Ale opět, grafika GeForce RTX 4070 může vyjít s konfigurací, která bude kvůli výtěžnosti o něco ořezaná. AD103 má mít 256bitovou sběrnici, jako je čipů této třídy zvykem.
Pro dostupnější nižší mainstream by pak byl čip AD104, který ale ovšem asi bude spíše duchovním nástupcem čipu GA106, protože snad má mít jen 192bitovou paměťovou sběrnici. Počet bloků SM by ale byl 60, tedy jako nyní u vyššího čipu GA103. Toto dává 7680 shaderů, ale opět, grafické karty (GeForce RTX 4060?) na něm založené mohou mít pár jednotek vypnutých kvůli výtěžnosti, aby se mohly uplatnit i křemíky s defektem.
From the same source: (all GPUs have no NVLink)
AD102(72 TPC) – 384bit
AD103(42 TPC) – 256bit
AD104(30 TPC) – 192bit
AD106(18 TPC) – 128bit
AD107(12 TPC) – 128bit— No one (@no_one180) March 2, 2022
Dvě 128bitová GPU v lowendu
Nvidia dále chystá dva čipy pro levnější grafiky, které už také mohou asi být hodně zaměřené na použití v noteboocích. AD106 bude mít 36 bloků SM, což je 4608 shaderů. AD107 má 24 bloků SM, což je 3072 shaderů. Obě tato GPU mají 128bitovou paměťovou sběrnici, Nvidia tedy nechce jít níž, ale je samozřejmě možné, že vydá nějaké grafiky, které budou reálně využívat jen část této šířky (třeba 96 nebo 64 bitů). Tato GPU už asi také mohou mít zredukovanou šířku rozhraní PCI Express třeba jen na 8 linek (nebo dokonce jen 4, pokud by třeba AD107 bylo určené pro notebookovou řadu GeForce MX).
GPU Lovelace bude Nvidia vyrábět na 5nm procesu TSMC, který by měl být výrazně lepší, než 8nm proces Samsungu u čipů Ampere. Minimálně nejvýkonnější AD102 bude 5nm určitě, u ostatních čipů není úplně vyloučené, že by třeba také mohly některé být místo toho vyráběné u Samsungu (ovšem pořád by to mohlo být na jeho 5nm procesu).
Architektura Lovelace by měla přinést i různé zatím tajné novinky ve funkcích a výbavě, dá se očekávat například podpora PCI Expressu 5.0 (NVLink prý ale mít nebude), nebo výstupu DisplayPort 2.0 či nový enkodér videa – možná již s podporou komprese do formátu AV1. Toto jsou zatím jen spekulace, ovšem úniky z ovladačů by něco z tohoto mohly potvrdit nebo vyvrátit.
Zdroj: La Frite David (Twitter)
Jan Olšan, redaktor Cnews.cz
⠀