Rozbor GPU Ampere: co je nového v architektuře GeForce RTX 3000

Parametry čipů GA102 a GA104, prvních dvou Amperů

Po stránce hardwaru byl tento měsíc obrazně řečeno celý zelený díky vydání nové generace grafických karet Nvidia, GeForce RTX 3000. Ty jsou založené na nové architektuře Ampere. Co přináší a v čem je nová proti Turingu, probereme v tomto článku: novou architekturu SM stojící za dvojnásobnými počty shaderů nebo výrobní proces nebo charakteristicky obou čipů, které zatím byly odhaleny.

GPU Ampere: GA102

Výkonnější z obou 8nm herních čipů Ampere má označení GA102 a nachází se v kartách RTX 3090 a RTX 3080. Fyzicky je v něm sedm základdních konstrukčních bloků GPC (Graphic Processing Cluster), z nichž každý obsahuje 6 bloků TPC (Texture Processing Cluster), ty se pak ještě dělí na dva bloky SM po 128 shaderech. Celé GA102 má 84 SM a tím pádem 10 752 shaderů. V každém bloku SM je jedno RT jádro (takže celkem 84) a čtyři tensor jádra (celkem 336).

Čip je velký 628,4 mm² a tvoří ho 28,3 miliard tranzistorů, obsahuje 6MB L2 cache (a množství 128KB L1 cachí v jednotlivých blocích, ty jsou také vylepšené proti Turingu). Kromě bloků SM s výpočetními (a také texturovacími) jednotkami obsahuje samozřejmě další například multimediální jednotky, paměťové řadiče GDDR6X či volitelně GDDR6 (podporováno je obojí) s celkovou 384bitovou šířkou.

Schéma plně aktivovaného GPU GA102

GA102 má také rozhraní NVLink třetí generace pro propojení dvou GPU (tři nebo čtyři karty propojit nelze). Celkem jde o čtyři ×4 rozhraní, které celkově dávají propustnost až 56,25 GB/s v obou směrech.

V grafikách GeForce je v obou modelech GA102 oříznuté. GeForce RTX 3090 ho má v téměř plné palbě, jsou vypnuté jen dva bloky SM, takže karta ztrácí 256 shaderů, 8 tensor a 2 RT jádra. GeForce RTX 3080 je osekaná výrazněji, přišla o celý jeden GPC a čtyři další SM – má jen 8704 shaderů (68 bloků SM), 68 RT jader a 272 tensor jader. Také je u ní zkrácena paměťová sběrnice na jen 320 bitů, tj. jsou vypnuté 2 z 12 kanálů.

GA104

Dále má Nvidia v pořadí levnější model GPU Ampere, jenž by měl mít asi 48 bloků SM, čili 6144 shaderů, 192 tensor jader a 48 RT jader. Je použitý v GeForce RTX 3070 opět s mírným oříznutím: aktivní je 46 SM/5888 shaderů a 46 RT jader/184 tensor jader. Organizace čipu je jiná – má šest GPC, v nichž jsou místo 6 TPC vždy jen 4 bloky TPC. Každý TPC má pak dva bloky SM, dál je to již stejné.

Schéma plně aktivovaného GPU GA104

Tento čip má 256bitový paměťový řadič, zatím použitý s GDDR6, ale není vyloučeno, že je podporována i GDDR6X. Čip obsahuje 4MB L2 cache a je podle Nvidie složen ze 17,4 miliardy tranzistorů. Jeho plocha je 392 mm².

ROP budou teď vázané na bloky GPC

Poměrně důležitá změna v Ampere je v organizaci jednotek ROP. Předchozí architektury je měly svázané s paměťovým řadičem a L2 cache, takže například 192bitová karta musela vždy mít 48 ROP, 256bitová 64 ROP, 384bitová 96.

U Ampere tuto vázanost Nvidia zrušila a ROP jsou naopak vázané na bloky GPC a škálují s nimi. Každý blok GPC by jich měl mít 16, takže čip GA104 obsahuje 96 ROP a čip GA102 už 112 ROP díky sedmi aktivním blokům GPC (RTX 3080 je tedy asi oseknutá na 96 ROP).

  •  
  •  
  •  
Flattr this!

První specifikace karet GeForce RTX 3000 Super: bez větší paměti

Už nějakou dobu se objevují informace, že Nvidia stejně jako u architektury Turing vyrobí zhruba po roce působení grafik generace Ampere její refresh, tedy nové modely s vyšším výkonem, které zřejmě budou označené jako RTX 3000 Super. Na internetu se teď objevily předběžné specifikace těchto karet od osvědčeného zdroje Kopite7kimi. Máme počty jednotek a paměti, u kterých to ale vypadá, že Nvidia nechystá vytoužené vyšší kapacity. Celý článok „První specifikace karet GeForce RTX 3000 Super: bez větší paměti“ »

  •  
  •  
  •  

Nvidia DLAA: vyhlazování na principu DLSS, ale bez upscalingu

Když před třemi roky vyšly GeForce RTX 2000 a Nvidia představovala budoucí technologii DLSS, mluvila nejen o AI upscalingu, kterým je DLSS teď známé. Oznámen byl i režim „DLSS 2X“, v kterém neuronová síť prováděla jen vyhlazování a další postprocessing, ale už ne upscaling. Snažila by se čistě o zlepšení kvality, ne o zrychlení. Tato část se ale nikdy nerealizovala. Až teď to vypadá, že se jí dočkáme, ale pod novým jménem: DLAA. Celý článok „Nvidia DLAA: vyhlazování na principu DLSS, ale bez upscalingu“ »

  •  
  •  
  •  

Čipů Ampere není dost. Znovu se vrátí GeForce RTX 2060, ale 12GB

Z oblasti grafických karet přichází hodně divoká zpráva, zároveň také ukazující bídu, která panuje kvůli kryptoměnové bublině. Ač už brzo uplyne rok od vydání nové generace grafik, Nvidia zřejmě pořád nebude mít dost těchto čipů. Došlo to tak daleko, že vrátí do výroby starý model GeForce RTX 2060 generace Turing, aby díru na trhu pomohl zaplnit. Ale zvětší této kartě kritizovanou 6GB paměť, takže to současně bude i novinka. Celý článok „Čipů Ampere není dost. Znovu se vrátí GeForce RTX 2060, ale 12GB“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *