Rozbor GPU Ampere: co je nového v architektuře GeForce RTX 3000 - Page 2 of 5

Parametry čipů GA102 a GA104, prvních dvou Amperů

Po stránce hardwaru byl tento měsíc obrazně řečeno celý zelený díky vydání nové generace grafických karet Nvidia, GeForce RTX 3000. Ty jsou založené na nové architektuře Ampere. Co přináší a v čem je nová proti Turingu, probereme v tomto článku: novou architekturu SM stojící za dvojnásobnými počty shaderů nebo výrobní proces nebo charakteristicky obou čipů, které zatím byly odhaleny.

GPU Ampere: GA102

Výkonnější z obou 8nm herních čipů Ampere má označení GA102 a nachází se v kartách RTX 3090 a RTX 3080. Fyzicky je v něm sedm základdních konstrukčních bloků GPC (Graphic Processing Cluster), z nichž každý obsahuje 6 bloků TPC (Texture Processing Cluster), ty se pak ještě dělí na dva bloky SM po 128 shaderech. Celé GA102 má 84 SM a tím pádem 10 752 shaderů. V každém bloku SM je jedno RT jádro (takže celkem 84) a čtyři tensor jádra (celkem 336).

Čip je velký 628,4 mm² a tvoří ho 28,3 miliard tranzistorů, obsahuje 6MB L2 cache (a množství 128KB L1 cachí v jednotlivých blocích, ty jsou také vylepšené proti Turingu). Kromě bloků SM s výpočetními (a také texturovacími) jednotkami obsahuje samozřejmě další například multimediální jednotky, paměťové řadiče GDDR6X či volitelně GDDR6 (podporováno je obojí) s celkovou 384bitovou šířkou.

GA102 má také rozhraní NVLink třetí generace pro propojení dvou GPU (tři nebo čtyři karty propojit nelze). Celkem jde o čtyři ×4 rozhraní, které celkově dávají propustnost až 56,25 GB/s v obou směrech.

V grafikách GeForce je v obou modelech GA102 oříznuté. GeForce RTX 3090 ho má v téměř plné palbě, jsou vypnuté jen dva bloky SM, takže karta ztrácí 256 shaderů, 8 tensor a 2 RT jádra. GeForce RTX 3080 je osekaná výrazněji, přišla o celý jeden GPC a čtyři další SM – má jen 8704 shaderů (68 bloků SM), 68 RT jader a 272 tensor jader. Také je u ní zkrácena paměťová sběrnice na jen 320 bitů, tj. jsou vypnuté 2 z 12 kanálů.

GA104

Dále má Nvidia v pořadí levnější model GPU Ampere, jenž by měl mít asi 48 bloků SM, čili 6144 shaderů, 192 tensor jader a 48 RT jader. Je použitý v GeForce RTX 3070 opět s mírným oříznutím: aktivní je 46 SM/5888 shaderů a 46 RT jader/184 tensor jader. Organizace čipu je jiná – má šest GPC, v nichž jsou místo 6 TPC vždy jen 4 bloky TPC. Každý TPC má pak dva bloky SM, dál je to již stejné.

Tento čip má 256bitový paměťový řadič, zatím použitý s GDDR6, ale není vyloučeno, že je podporována i GDDR6X. Čip obsahuje 4MB L2 cache a je podle Nvidie složen ze 17,4 miliardy tranzistorů. Jeho plocha je 392 mm².

ROP budou teď vázané na bloky GPC

Poměrně důležitá změna v Ampere je v organizaci jednotek ROP. Předchozí architektury je měly svázané s paměťovým řadičem a L2 cache, takže například 192bitová karta musela vždy mít 48 ROP, 256bitová 64 ROP, 384bitová 96.

U Ampere tuto vázanost Nvidia zrušila a ROP jsou naopak vázané na bloky GPC a škálují s nimi. Každý blok GPC by jich měl mít 16, takže čip GA104 obsahuje 96 ROP a čip GA102 už 112 ROP díky sedmi aktivním blokům GPC (RTX 3080 je tedy asi oseknutá na 96 ROP).

⠀

Continue: Nová architektura shaderů, jak je to s 2× FP32 jednotkami

Flattr this!

GeForce GeForce RTX GPU Nvidia Nvidia Ampere

Súvisiace články

Nvidia chce oživit SFF herní PC a malé grafiky, chystá standard

Grafiky, PC skrinky, PC zostavy, Správy | 19. 4. 202419. 4. 2024 | Jan Olšan

Grafické karty za poslední roky hodně přibraly – délky i tloušťky trhají rekordy, zatímco před deseti lety byly tříslotové karty výjimka. Z trojventilátorových chladičů se stala norma a tyto dlouhé chladiče používají i karty s nízkým TDP v podstatě kvůli vzhledu. Toto ale likviduje možnosti stavby malých herních PC v SFF skříních. Snad se ale situace zlepší, Nvidia totiž chystá iniciativu, která má pomoct malá PC zase zpopularizovat. Celý článok „Nvidia chce oživit SFF herní PC a malé grafiky, chystá standard“ »

Ray tracing pro staré hry. Otestovali jsme NVIDIA RTX Remix

Extra testy, Grafiky | 12. 4. 202418. 4. 2024 | Jan Olšan

Občas lidi říkají, že dnešní hry se nevyrovnají těm starým a kromě grafiky toho moc nenabízí. Co kdyby se ale dala moderní grafika doplnit do klasických pecek starých i třeba dvacet let? Právě k tomu má sloužit technologie (nebo software) RTX Remix od NVIDIE, která má umožnit relativně snadno přidat i do velmi starých her pomocí modu kvalitnější grafiku – včetně raytracingových efektů i věcí jako je DLSS nebo DLAA. Podíváme se, jak to funguje. Celý článok „Ray tracing pro staré hry. Otestovali jsme NVIDIA RTX Remix“ »

Blackwell vyjde letos, GeForce RTX 5080 a RTX 5090 koncem roku?

O víkendu tu byly informace o nové generaci grafik od AMD, teď pro změnu o tom, co chystá Nvidia. Jak si asi pamatujete, doposud jsme operovali s tím, že příchod nové generace GeForce (pravděpodobně s označením RTX 5000) bude po trošku delší době než po tradičních dvou letech. Přímo oficiální dokument Nvidie totiž next-gen herní GPU ukazoval až na rok 2025. Ale vypadá to, že Nvidia vydání urychlí a bude přece jenom letos. Celý článok „Blackwell vyjde letos, GeForce RTX 5080 a RTX 5090 koncem roku?“ »

Pridaj komentár Zrušiť odpoveď

Ľubomír Samák on Displej na chladiči CPU: Náhľad DeepCool AK620 DigitalMôže byť, ale asi to bude individuálne a niekto to môže vyhodnotiť aj opačne. Pokiaľ...
Ľubomír Samák on Axagon CLR-M2XT. So 40 rebrami na výkonné SSDJe možné, že v systémoch, kde bude prúdenie vzduchu lepšie optimalizované pre priečne rebrovaní sa...
Ľubomír Samák on Axagon CLR-M2XT. So 40 rebrami na výkonné SSDAsi nechápem. :)
Bufo on Axagon CLR-M2XT. So 40 rebrami na výkonné SSDĽubo,... keď si dal pod nálepku "Approved" takúto fotku, tak si myslím, že môžeš v...
the patient on Axagon CLR-M2XT. So 40 rebrami na výkonné SSDKontraintuitivnost těch výsledků asi dost lidí zarazí. Kdo by řekl, že CLR-M2XT bude horší než...
miro on Displej na chladiči CPU: Náhľad DeepCool AK620 Digitaltak potom je aj tak pohodlnejšie sledovať údaje na monitore, ako pomrkávať do skrine položenej...
miro on Displej na chladiči CPU: Náhľad DeepCool AK620 Digitaluhádol si, nemal... s tým zdrojom to dáva celkom zmysel, monitorovať teplotu, výkon na vetvách,...
Ľubomír Samák on Displej na chladiči CPU: Náhľad DeepCool AK620 DigitalÁno, jedná sa o údaje, ktoré monitoruje základná doska a chladič sa k nim dostáva...
the patient on Nvidia chce oživit SFF herní PC a malé grafiky, chystá standardŠtosovat je těsně vedle sebe nebude nejlepší nápad. S tolika kabely považuji modulární provedení užitečné....