GPU Nvidia Lovelace/Ada převzala hlavní trumf architektury RDNA 2

Infinity Cache i u GeForce. RTX 4000 má gigantickou L2 cache

Předevčírem jsme psali o specifikacích GPU Nvidia Lovelace získaných ze zdrojových kódů ovladačů, které firmě ukradli hackeři a poté zveřejnili. Mezitím byla objevená další zásadní věc. Architektura Lovelace přinese velkou novinku: výrazně zvětší paměti cache. To dovolí dosáhnout se stejnou fyzickou propustností pamětí vyššího výkonu. Nvidia de facto chystá vlastní verzi Infinity Cache, uvedené v GPU architektuře RDNA 2 od AMD.

Kód v připravovaných ovladačích ukazuje že GPU architektury Lovelace, nebo možná spíš Ada (začíná to vypadat, že Nvidia se kloní k tomuto značení) budou mít v maximální konfiguraci až 96 MB „Nvinfinity“ Cache. Její funkce by asi měla být stejná jako u AMD, tedy držet přímo na čipu velkou část „horkých“ dat, s nimiž GPU při vykreslování her pracuje, a tím uspořit potřebu přístupů do paměti.

Podle experimentů AMD prý 128MB Infinity Cache způsobuje, že se GPU s 512GB/s propustností chová jako by mělo propustnost dvojnásobnou nebo i vyšší. Takováto cache sice na čipu zabere hodně místa (v kterém by jinak možná mohly být výpočetní jednotky), ale měla by zlepšovat energetickou efektivitu i výkon. A teoreticky může výsledné GPU i zlevnit, protože se může použít o něco užší paměťová sběrnice s levnějším PCB a méně paměťovými čipy. To, že se Nvidia přikloní k podobnému řešení, asi potvrzuje, že zde mělo AMD správný instinkt.

Ještě nevíme, jestli obdoba/nápodoba u Nvidie bude mít také nějaké speciální jméno. Podle ovladačů jde o zvětšenou L2 cache (u AMD by Infinity Cache snad měla být L3 cache). Tato velká L2 cache bude podle všeho mít kapacitu závisející na šířce paměťového řadiče. Minimálně u části GPU by vždy na každých 64 bitů paměťového řadič mělo připadnout 16 MB L2 cache. To znamená, že highendový čip AD102 s 18 432 shadery a 384bitovou paměťovou sběrnicí dostane 96 MB L2 cache. U architektury Ampere byla L2 cache v 512KB blocích pro každých 32 bitů řadiče (což je jeden kanál), celkově jen 6 MB. Rozdíl tedy bude diametrální, i když celková kapacita bude nakonec nižší, než mělo AMD v nejvýkonnější implementaci architektury RDNA 2 (čip Navi 12 obsahuje 128 MB Infinity Cache).

Podle této matematiky by tedy další čipy architektury Ada/Lovelace měly mít nižší kapacity L2 cache. AD103 s 10 752 shadery a 256bitovými paměťmi bude mít 64MB L2 cache, AD104 (7680 shaderů) se 192bitovými pamětmi by pak dostal 48 MB. Malé čipy AD106 a AD107 mají údajně 128bitovou sběrnici, takže by měly nést 32 MB L2 cache – pokud ji Nvidia třeba u druhého ještě víc neočeše třeba na polovinu, jako to u levnějších GPU (Navi 23, Navi 24) udělalo AMD. Případně by asi velká cache u nich mohla být vypuštěná pro zlevnění – nabízelo by se, že levnější čip AD107 by mohl být bez velké cache. Ale toto už je jen spekulace. Je možné, že Nvidia zachová úplně stejnou konfiguraci kapacity na kanál pamětí u všech GPU.

GPU architektury Ada/Lovelace budou vyráběná 5nm procesem TSMC, který jim dodá značné zlepšení energetické efektivity proti ne úplně nejlepšímu 8nm procesu Samsungu použitém v GPU Ampere – může jít o skok odpovídající generaci a půl až dvěma generacím výrobního procesu. 5nm proces zároveň zmenší velikost buněk SRAM této cache na čipu, takže pomůže snížit její dopad na plochu a cenu čipu. Zabraná plocha by měla být o dost nižší než u Infinity Cache v nynějších 7nm GPU od AMD.

Vizualizace GPU Ampere (GA102)

Čip AD102 má 600 mm² po optimalizacích

Podle leakera Kopite7kimi Nvidia také údajně udělala určité optimalizace v čipu, které mají ušetřit plochu, ale také kontakty BGA pouzdra. Z GPU (včetně nejvyššího AD102) údajně úplně vypadla konektivita NVLink a Nvidia prý snížila i počet obrazových výstupů, ale nevíme na kolik.

Potřeba šetřit kontakty na čipu má ovšem ne úplně potěšitelný důvod – prý je to proto, aby bylo k dispozici více kontaktů pro napájení. Jinými slovy, aby GPU mohlo spotřebovávat více energie. Celkově GPU AD102, tedy nejvýkonnější verze Ada/Lovelace a GeForce RTX 4000, má mít plochu „jen“ asi 600 mm². Toto uvádí přímo leaker Kopite7kimi, jenž je velmi spolehlivý.

Více: Šílené spotřeby grafik? GeForce RTX 4000 by prý mohly dosáhnout TDP přes 800 W

Zdroje: VideoCardz. XinoAssassin, Kopite7kimi

Jan Olšan, redaktor Cnews.cz


  •  
  •  
  •  
Flattr this!

Microsoft má vlastní ARM procesory. A k nim i čipy pro AI

Už nějakou dobu se šíří informace o tom, že Microsoft pracuje na vlastních čipech pro akceleraci umělé inteligence, kterými by ve svých datacentrech doplnil, pokud ne rovnou nahradil značně drahá GPU od Nvidie. Společnost je teď skutečně oficiálně oznámila, ale nezůstalo jen u akcelerátorů AI. Microsoft představil také vlastní procesory pro servery založené na architektuře ARM, kterými se zařadí po bok Amazonu a jeho Gravitonů. Celý článok „Microsoft má vlastní ARM procesory. A k nim i čipy pro AI“ »

  •  
  •  
  •  

Radeon RX 7900 GRE už je volně v prodeji, dá se koupit v ČR

Dříve to chodilo tak, že když byly nějaké grafiky nebo procesory uvedené jako regionální speciální produkt pro Čínu, k nám se nedostaly. Když ale letos AMD vydalo čínský (označení odkazuje k roku králíka) Radeon RX 7900 GRE, ukázalo se nakonec, že bude dostupný i ve světě a v Evropě na OEM trhu – tedy pro nás v rámci hotových sestav. Ale jak jsme trochu doufali, už si do internetových obchodů našly cestu i jen samotné karty. Celý článok „Radeon RX 7900 GRE už je volně v prodeji, dá se koupit v ČR“ »

  •  
  •  
  •  

Čipletový Radeon RX 7900M pro notebooky vydán, soupeř RTX 4080

AMD včera odhalovalo novou generaci Threadripperů Pro i ne-Pro s architekturou Zen 4 na nových platformách WRX90 a TRX50. Ale ve stejný den také firma odhalila zatím nejvýkonnější grafiku Radeon pro notebooky, model Radeon RX 7900M používající architekturu RDNA 3 a poprvé také čipletovou koncepci, díky které je založený na nejvýkonnějším GPU řady Navi 31, byť se zúženou 256bitovou pamětí jako u Navi 32. Celý článok „Čipletový Radeon RX 7900M pro notebooky vydán, soupeř RTX 4080“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *