Rozbor GPU Ampere: co je nového v architektuře GeForce RTX 3000

Nový výrobní proces 8N: technologie Samsungu vylepšená speciálně pro Nvidii

Po stránce hardwaru byl tento měsíc obrazně řečeno celý zelený díky vydání nové generace grafických karet Nvidia, GeForce RTX 3000. Ty jsou založené na nové architektuře Ampere. Co přináší a v čem je nová proti Turingu, probereme v tomto článku: novou architekturu SM stojící za dvojnásobnými počty shaderů nebo výrobní proces nebo charakteristicky obou čipů, které zatím byly odhaleny.

Vše nové: proces, architektura i paměti a konektivita

Ampere je po všech stránkách nová generace GPU. Spojuje trojici inovací: nový výrobní proces, novou architekturu samotných bloků a výpočetních jednotek GPU, ale tentokrát rovnou i novou technologii pamětí GDDR6X, lišící se od předchozích využitím efektivnější signalizace PAM4. Té jsme se ovšem již věnovali samostatně zde.

Výrobní proces: speciální upravená technologie 8N

Už poměrně dlouho se objevovaly informace, že Nvidia začne GPU vyrábět u Samsungu místo u TSMC, které je nejetablovanější ze zakázkových „Foundry“ továren. Nvidia již používala 14nm proces Samsungu (14LPP) pro některé méně výkonné čipy Pascal (GP107 v GeForce GTX 1050/1050 Ti). Když se tedy už loni objevily zprávy, že Nvidia pro čipy příští generace použije proces Samsungu, uvažovalo se nejdřív, že půjde o něco podobného.

Nakonec je v generaci Ampere situace jiná. Nvidia vyrábí u Samsungu nejvýkonnější modely GPU, GA102 a GA104, jen výpočetní GA100 pro servery je vyráběn na 7nm procesu TSMC. Herní Ampere je ale specifické nejen tím, že je od Samsungu, ale také tím, že není 7nm. Nvidia zvolila starší technologii Samsungu, tzv. 8nm proces, jenž je vylepšeným derivátem 10nm generace.

Slajd, kde Nvidia oznamuje použití 8nm procesu 8N

Proces se označuje 8N, protože je specificky určený pro Nvidii a měl by obsahovat různá neupřesněná vylepšení a úpravy pro její potřeby. Mělo by jít tedy o lepší technologii než je proces 8LPP, který používají některé mobily, podle některých informací úpravy pro Nvidii mají za výsledek až o 10 % vyšší výkon (čímž se myslí vyšší dosažená frekvence) než původní verze procesu zaměřená spíše na mobilní SOC. Ovšem tento proces dosahuje pravděpodobně nižší energetickou efektivitu a hustotu tranzistorů než reálný 7nm proces, jenž je už u Samsungu založený na EUV litografii. Pravděpodobně jsou vlastnosti také o něco méně dobré než u 7nm procesu TSMC.

Nvidia sice uvádí v marketingových materiálech až 1,9× nárůst energetické efektivity, ale to je značně přehnané. Ve srovnání výkonů a spotřeb pro grafiku GeForce RTX 3080/3090 při hraní vychází výrazně horší faktory (cca 1,1–1,3× podle okolností). Ovšem pozor – pokud by Nvidia nastavila stejná TDP jako u Turingu, vycházela by asi efektivita výrazně lépe (jen by výkon byl nižší). Konkrétní číslo závisí na tom, jak agresivně jsou taktované srovnávané čipy, takže nelze říct, jaký je mezi Turingem a Ampere faktor obecně.

Slajd, kde Nvidia tvrdí, že Ampere má 1,9× energetickou efektivitu. Jde však zdá se o srovnání podtaktovaného GA102 s TU102 na standardním taktu, což je v praxi nerealistické

Proces je každopádně jen implementační detail, který pro uživatele není přímo důležitý, pro nás budou rozhodovat až finální výsledky. 8nm proces je ostatně také pořád generační posun proti 12nm technologii používané v Turingu (12nm proces TSMC je derivát jeho 16nm technologie použité v GPU Pascal).

Další informace: Parametry, ceny, výkon karet Nvidia GeForce RTX 3090, 3080 a 3070

Je možné, že Nvidia původně počítala s o něco vyšší energetickou efektivitou, protože GPU Ampere na procesu 8N mají nezvykle vysoká TDP (GeForce RTX 3080 320 W, RTX 3090 rovnou 350 W). Je teoreticky možné, že spotřeba vyšla vyšší než plánovaná, ale to nevíme – Nvidia klidně mohla na vyšší spotřeby cílit od počátku.

GPU GA102,verze z GeForce RTX 3080 (Zdroj: techPowerUp)

Volba 8nm procesu byla prakticky určitě vědomá, nejde asi o to, že by pro Ampere nezbývaly 7nm kapacity a 8nm proces byl „nouzové řešení“. Nvidia pravděpodobně použila 8nm technologii proto, že GPU s ní stojí výrazně méně na výrobu, i když se započte jejich vyšší plocha. Podobné to bylo i s volbou 12nm procesu u Turingu. To, že Nvidia zvolila Samsung místo TSMC, nejspíš přineslo další úsporu, protože Samsung se snaží pro svůj Foundry byznys agresivně získat klienty a nabídl pravděpodobně štědrou slevu, zatímco TSMC má dalších klientů dost a nemělo motivaci snížit si marži podobně nízkou cenou.

Výsledkem každopádně je, že karty Ampere budou po stránce GPU (ale ne nutně po stránce PCB, VRM a pamětí) relativně levné na výrobu, což bude důležité v konkurenčním boji se 7nm Radeony (jejichž čipy jsou asi i při menší ploše dražší).


  •  
  •  
  •  
Flattr this!

Nvidia v generaci Blackwell zase chystá grafiku Titan… pro AI?

Ač to možná zní těžko uvěřitelně, Nvidia v aktuální generaci grafik GeForce RTX 4000 vlastně nikdy neukázala plný potenciál jejich GPU. Nejvyšší herní model GeForce RTX 4090 totiž má použité GPU AD102 poměrně dost ořezané – aktivních je v něm jen 128 ze 144 jednotek. Plnou palbu měl mít model Titan, jenže Nvidia ho zrušila. Nyní ale přicházejí zprávy, že v generaci RTX 5000 by to mohlo být jinak a grafika Titan je opět připravována. Celý článok „Nvidia v generaci Blackwell zase chystá grafiku Titan… pro AI?“ »

  •  
  •  
  •  

GeForce RTX 5000 nestihnou letošní vydání, přijdou až příští rok

Před nedávnem jsme tu měli nepříjemnou zprávu pro příznivce grafik AMD, totiž že grafiky Radeon nové generace RX 8000 vyjdou až po novém roce, pravděpodobně v lednu okolo CES 2025. Tehdy jsme upozorňovali, že by tím pádem přišly na trh až po novém highendovém GPU Nvidie (přičemž samy budou pokrývat mainstream). Nicméně se zdá, že i u Nvidie se vydání nové generace grafik posouvá. Nakonec tak letos vydá novinky možná jen Intel. Celý článok „GeForce RTX 5000 nestihnou letošní vydání, přijdou až příští rok“ »

  •  
  •  
  •  

„Všetky“ grafické karty v analýze hlučnosti cievok

Počet otestovaných grafických kariet za uplynulé obdobie sa dostal na číslo 30, po ktorom sa môžeme trochu zastaviť a špeciálne sa zamerať na hlučnosť cievok. Tá bola v rámci štandardných meraní zaznamenávaná vždy, ale vo veľkých testoch s kopou iných informácií, sa tieto unikátne údaje strácali. Aj preto to bude teraz, v rámci tohto článku iba k nim. Ktorá z moderných grafických kariet má teda tichšie cievky? Celý článok „„Všetky“ grafické karty v analýze hlučnosti cievok“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *