Rozbor GPU Ampere: co je nového v architektuře GeForce RTX 3000

Parametry čipů GA102 a GA104, prvních dvou Amperů

Po stránce hardwaru byl tento měsíc obrazně řečeno celý zelený díky vydání nové generace grafických karet Nvidia, GeForce RTX 3000. Ty jsou založené na nové architektuře Ampere. Co přináší a v čem je nová proti Turingu, probereme v tomto článku: novou architekturu SM stojící za dvojnásobnými počty shaderů nebo výrobní proces nebo charakteristicky obou čipů, které zatím byly odhaleny.

GPU Ampere: GA102

Výkonnější z obou 8nm herních čipů Ampere má označení GA102 a nachází se v kartách RTX 3090 a RTX 3080. Fyzicky je v něm sedm základdních konstrukčních bloků GPC (Graphic Processing Cluster), z nichž každý obsahuje 6 bloků TPC (Texture Processing Cluster), ty se pak ještě dělí na dva bloky SM po 128 shaderech. Celé GA102 má 84 SM a tím pádem 10 752 shaderů. V každém bloku SM je jedno RT jádro (takže celkem 84) a čtyři tensor jádra (celkem 336).

Čip je velký 628,4 mm² a tvoří ho 28,3 miliard tranzistorů, obsahuje 6MB L2 cache (a množství 128KB L1 cachí v jednotlivých blocích, ty jsou také vylepšené proti Turingu). Kromě bloků SM s výpočetními (a také texturovacími) jednotkami obsahuje samozřejmě další například multimediální jednotky, paměťové řadiče GDDR6X či volitelně GDDR6 (podporováno je obojí) s celkovou 384bitovou šířkou.

Schéma plně aktivovaného GPU GA102

GA102 má také rozhraní NVLink třetí generace pro propojení dvou GPU (tři nebo čtyři karty propojit nelze). Celkem jde o čtyři ×4 rozhraní, které celkově dávají propustnost až 56,25 GB/s v obou směrech.

V grafikách GeForce je v obou modelech GA102 oříznuté. GeForce RTX 3090 ho má v téměř plné palbě, jsou vypnuté jen dva bloky SM, takže karta ztrácí 256 shaderů, 8 tensor a 2 RT jádra. GeForce RTX 3080 je osekaná výrazněji, přišla o celý jeden GPC a čtyři další SM – má jen 8704 shaderů (68 bloků SM), 68 RT jader a 272 tensor jader. Také je u ní zkrácena paměťová sběrnice na jen 320 bitů, tj. jsou vypnuté 2 z 12 kanálů.

GA104

Dále má Nvidia v pořadí levnější model GPU Ampere, jenž by měl mít asi 48 bloků SM, čili 6144 shaderů, 192 tensor jader a 48 RT jader. Je použitý v GeForce RTX 3070 opět s mírným oříznutím: aktivní je 46 SM/5888 shaderů a 46 RT jader/184 tensor jader. Organizace čipu je jiná – má šest GPC, v nichž jsou místo 6 TPC vždy jen 4 bloky TPC. Každý TPC má pak dva bloky SM, dál je to již stejné.

Schéma plně aktivovaného GPU GA104

Tento čip má 256bitový paměťový řadič, zatím použitý s GDDR6, ale není vyloučeno, že je podporována i GDDR6X. Čip obsahuje 4MB L2 cache a je podle Nvidie složen ze 17,4 miliardy tranzistorů. Jeho plocha je 392 mm².

ROP budou teď vázané na bloky GPC

Poměrně důležitá změna v Ampere je v organizaci jednotek ROP. Předchozí architektury je měly svázané s paměťovým řadičem a L2 cache, takže například 192bitová karta musela vždy mít 48 ROP, 256bitová 64 ROP, 384bitová 96.

U Ampere tuto vázanost Nvidia zrušila a ROP jsou naopak vázané na bloky GPC a škálují s nimi. Každý blok GPC by jich měl mít 16, takže čip GA104 obsahuje 96 ROP a čip GA102 už 112 ROP díky sedmi aktivním blokům GPC (RTX 3080 je tedy asi oseknutá na 96 ROP).


  •  
  •  
  •  
Flattr this!

GeForce RTX 5090 má opět verzi D pro Čínu, výkon ale bude stejný

Před rokem kvůli americkým sankcím majícím za cíl omezit přístup Číny k výkonné akceleraci umělé inteligence začala Nvidia na tamním trhu prodávat místo GeForce RTX 4090 ořezaný model RTX 4090D, protože highendové herní GPU už naráželo na limity výkonu, předepsané sankcemi. Stejný problém bude mít logicky i nová generace Blackwell. Nvidia v ní také chystá speciální čínský model RTX 5090D, ale výkon má údajně mít neomezený. Celý článok „GeForce RTX 5090 má opět verzi D pro Čínu, výkon ale bude stejný“ »

  •  
  •  
  •  

Už máme specifikace GeForce RTX 5070 a GeForce RTX 5070 Ti

Až v novém roce sice dojde k vydání nové generace grafik od Nvidie, přesto už ale začaly prosakovat podrobnosti o chystaných modelech, které v prvních měsících roku 2025 vyjdou. Během týdne se sešly novinky k GeForce RTX 5090 coby nejvýkonnějšímu modelu, ale zejména i k levnějším GeForce RTX 5070 Ti a GeForce RTX 5070, což mohou být zrovna karty, které budou vzhledem k cenám „highendu“ zajímat nejvíc hráčů. Celý článok „Už máme specifikace GeForce RTX 5070 a GeForce RTX 5070 Ti“ »

  •  
  •  
  •  

Při koupi grafik GeForce RTX 4000 lze teď dostat hru zadarmo

Před nedávnem Nvidia dávala jako bonus hru Dragon Age: The Veilguard k předplatnému streamovací služby GeForce Now, u čehož se dalo litovat, že se hra zadarmo nepřihazovala k nákupům fyzických grafických karet. To ale přišlo teď před Vánoci, firma spustila další tzv. bundle pro grafiky generace GeForce RTX 4000. Možná jako rozlučku (nebo spíše asi snahu vyprázdnit sklady) před příchodem nové generace po novém roce. Celý článok „Při koupi grafik GeForce RTX 4000 lze teď dostat hru zadarmo“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *