Parametry čipů GA102 a GA104, prvních dvou Amperů
Po stránce hardwaru byl tento měsíc obrazně řečeno celý zelený díky vydání nové generace grafických karet Nvidia, GeForce RTX 3000. Ty jsou založené na nové architektuře Ampere. Co přináší a v čem je nová proti Turingu, probereme v tomto článku: novou architekturu SM stojící za dvojnásobnými počty shaderů nebo výrobní proces nebo charakteristicky obou čipů, které zatím byly odhaleny.
GPU Ampere: GA102
Výkonnější z obou 8nm herních čipů Ampere má označení GA102 a nachází se v kartách RTX 3090 a RTX 3080. Fyzicky je v něm sedm základdních konstrukčních bloků GPC (Graphic Processing Cluster), z nichž každý obsahuje 6 bloků TPC (Texture Processing Cluster), ty se pak ještě dělí na dva bloky SM po 128 shaderech. Celé GA102 má 84 SM a tím pádem 10 752 shaderů. V každém bloku SM je jedno RT jádro (takže celkem 84) a čtyři tensor jádra (celkem 336).
Čip je velký 628,4 mm² a tvoří ho 28,3 miliard tranzistorů, obsahuje 6MB L2 cache (a množství 128KB L1 cachí v jednotlivých blocích, ty jsou také vylepšené proti Turingu). Kromě bloků SM s výpočetními (a také texturovacími) jednotkami obsahuje samozřejmě další například multimediální jednotky, paměťové řadiče GDDR6X či volitelně GDDR6 (podporováno je obojí) s celkovou 384bitovou šířkou.
GA102 má také rozhraní NVLink třetí generace pro propojení dvou GPU (tři nebo čtyři karty propojit nelze). Celkem jde o čtyři ×4 rozhraní, které celkově dávají propustnost až 56,25 GB/s v obou směrech.
V grafikách GeForce je v obou modelech GA102 oříznuté. GeForce RTX 3090 ho má v téměř plné palbě, jsou vypnuté jen dva bloky SM, takže karta ztrácí 256 shaderů, 8 tensor a 2 RT jádra. GeForce RTX 3080 je osekaná výrazněji, přišla o celý jeden GPC a čtyři další SM – má jen 8704 shaderů (68 bloků SM), 68 RT jader a 272 tensor jader. Také je u ní zkrácena paměťová sběrnice na jen 320 bitů, tj. jsou vypnuté 2 z 12 kanálů.
GA104
Dále má Nvidia v pořadí levnější model GPU Ampere, jenž by měl mít asi 48 bloků SM, čili 6144 shaderů, 192 tensor jader a 48 RT jader. Je použitý v GeForce RTX 3070 opět s mírným oříznutím: aktivní je 46 SM/5888 shaderů a 46 RT jader/184 tensor jader. Organizace čipu je jiná – má šest GPC, v nichž jsou místo 6 TPC vždy jen 4 bloky TPC. Každý TPC má pak dva bloky SM, dál je to již stejné.
Tento čip má 256bitový paměťový řadič, zatím použitý s GDDR6, ale není vyloučeno, že je podporována i GDDR6X. Čip obsahuje 4MB L2 cache a je podle Nvidie složen ze 17,4 miliardy tranzistorů. Jeho plocha je 392 mm².
ROP budou teď vázané na bloky GPC
Poměrně důležitá změna v Ampere je v organizaci jednotek ROP. Předchozí architektury je měly svázané s paměťovým řadičem a L2 cache, takže například 192bitová karta musela vždy mít 48 ROP, 256bitová 64 ROP, 384bitová 96.
U Ampere tuto vázanost Nvidia zrušila a ROP jsou naopak vázané na bloky GPC a škálují s nimi. Každý blok GPC by jich měl mít 16, takže čip GA104 obsahuje 96 ROP a čip GA102 už 112 ROP díky sedmi aktivním blokům GPC (RTX 3080 je tedy asi oseknutá na 96 ROP).
⠀
- Contents
- Nový výrobní proces 8N: technologie Samsungu vylepšená speciálně pro Nvidii
- Parametry čipů GA102 a GA104, prvních dvou Amperů
- Nová architektura shaderů, jak je to s 2× FP32 jednotkami
- PCI Express 4.0, HDMI 2.1, AV1, 8K video a 8K (upscalované) hraní