Rozbor GPU Ampere: co je nového v architektuře GeForce RTX 3000

Po stránce hardwaru byl tento měsíc obrazně řečeno celý zelený díky vydání nové generace grafických karet Nvidia, GeForce RTX 3000. Ty jsou založené na nové architektuře Ampere. Co přináší a v čem je nová proti Turingu, probereme v tomto článku: novou architekturu SM stojící za dvojnásobnými počty shaderů nebo výrobní proces nebo charakteristicky obou čipů, které zatím byly odhaleny.

Vše nové: proces, architektura i paměti a konektivita

Ampere je po všech stránkách nová generace GPU. Spojuje trojici inovací: nový výrobní proces, novou architekturu samotných bloků a výpočetních jednotek GPU, ale tentokrát rovnou i novou technologii pamětí GDDR6X, lišící se od předchozích využitím efektivnější signalizace PAM4. Té jsme se ovšem již věnovali samostatně zde.

Výrobní proces: speciální upravená technologie 8N

Už poměrně dlouho se objevovaly informace, že Nvidia začne GPU vyrábět u Samsungu místo u TSMC, které je nejetablovanější ze zakázkových „Foundry“ továren. Nvidia již používala 14nm proces Samsungu (14LPP) pro některé méně výkonné čipy Pascal (GP107 v GeForce GTX 1050/1050 Ti). Když se tedy už loni objevily zprávy, že Nvidia pro čipy příští generace použije proces Samsungu, uvažovalo se nejdřív, že půjde o něco podobného.

Nakonec je v generaci Ampere situace jiná. Nvidia vyrábí u Samsungu nejvýkonnější modely GPU, GA102 a GA104, jen výpočetní GA100 pro servery je vyráběn na 7nm procesu TSMC. Herní Ampere je ale specifické nejen tím, že je od Samsungu, ale také tím, že není 7nm. Nvidia zvolila starší technologii Samsungu, tzv. 8nm proces, jenž je vylepšeným derivátem 10nm generace.

Slajd, kde Nvidia oznamuje použití 8nm procesu 8N

Proces se označuje 8N, protože je specificky určený pro Nvidii a měl by obsahovat různá neupřesněná vylepšení a úpravy pro její potřeby. Mělo by jít tedy o lepší technologii než je proces 8LPP, který používají některé mobily, podle některých informací úpravy pro Nvidii mají za výsledek až o 10 % vyšší výkon (čímž se myslí vyšší dosažená frekvence) než původní verze procesu zaměřená spíše na mobilní SOC. Ovšem tento proces dosahuje pravděpodobně nižší energetickou efektivitu a hustotu tranzistorů než reálný 7nm proces, jenž je už u Samsungu založený na EUV litografii. Pravděpodobně jsou vlastnosti také o něco méně dobré než u 7nm procesu TSMC.

Nvidia sice uvádí v marketingových materiálech až 1,9× nárůst energetické efektivity, ale to je značně přehnané. Ve srovnání výkonů a spotřeb pro grafiku GeForce RTX 3080/3090 při hraní vychází výrazně horší faktory (cca 1,1–1,3× podle okolností). Ovšem pozor – pokud by Nvidia nastavila stejná TDP jako u Turingu, vycházela by asi efektivita výrazně lépe (jen by výkon byl nižší). Konkrétní číslo závisí na tom, jak agresivně jsou taktované srovnávané čipy, takže nelze říct, jaký je mezi Turingem a Ampere faktor obecně.

Slajd, kde Nvidia tvrdí, že Ampere má 1,9× energetickou efektivitu. Jde však zdá se o srovnání podtaktovaného GA102 s TU102 na standardním taktu, což je v praxi nerealistické

Proces je každopádně jen implementační detail, který pro uživatele není přímo důležitý, pro nás budou rozhodovat až finální výsledky. 8nm proces je ostatně také pořád generační posun proti 12nm technologii používané v Turingu (12nm proces TSMC je derivát jeho 16nm technologie použité v GPU Pascal).

Další informace: Parametry, ceny, výkon karet Nvidia GeForce RTX 3090, 3080 a 3070

Je možné, že Nvidia původně počítala s o něco vyšší energetickou efektivitou, protože GPU Ampere na procesu 8N mají nezvykle vysoká TDP (GeForce RTX 3080 320 W, RTX 3090 rovnou 350 W). Je teoreticky možné, že spotřeba vyšla vyšší než plánovaná, ale to nevíme – Nvidia klidně mohla na vyšší spotřeby cílit od počátku.

GPU GA102,verze z GeForce RTX 3080 (Zdroj: techPowerUp)

Volba 8nm procesu byla prakticky určitě vědomá, nejde asi o to, že by pro Ampere nezbývaly 7nm kapacity a 8nm proces byl „nouzové řešení“. Nvidia pravděpodobně použila 8nm technologii proto, že GPU s ní stojí výrazně méně na výrobu, i když se započte jejich vyšší plocha. Podobné to bylo i s volbou 12nm procesu u Turingu. To, že Nvidia zvolila Samsung místo TSMC, nejspíš přineslo další úsporu, protože Samsung se snaží pro svůj Foundry byznys agresivně získat klienty a nabídl pravděpodobně štědrou slevu, zatímco TSMC má dalších klientů dost a nemělo motivaci snížit si marži podobně nízkou cenou.

Výsledkem každopádně je, že karty Ampere budou po stránce GPU (ale ne nutně po stránce PCB, VRM a pamětí) relativně levné na výrobu, což bude důležité v konkurenčním boji se 7nm Radeony (jejichž čipy jsou asi i při menší ploše dražší).


GeForce RTX 3060 se vrátí do prodeje, kvůli drahým pamětem

Zdá se, že zatímco drahé paměti a obecně rostoucí ceny hardwaru kvůli mánii investorů okolo umělé inteligence zatrhly uvedení nových lepších modelů grafik v podobě GeForce RTX 5000 Super, současně tato situace přivane na trh jiné novinky, byť možná takové, o které nikdo moc neprosil. Jednou z nich je, že se na trh zdá se vrátí pět let stará grafická karta GeForce RTX 3060, jejíž výroba už před časem skončila. Celý článok „GeForce RTX 3060 se vrátí do prodeje, kvůli drahým pamětem“ »

Dynamické generování snímků DLLS 4.5 vyjde za tři týdny

Už v lednu oznámila Nvidia příchod DLSS 4.5 – nové verze AI upscalingu pro hry, jejíž součástí je nový AI model, ale také vylepšená verze generování snímků. Ta umí vkládat až pět umělých mezisnímků mezi dva reálné snímky hry (takže počet zobrazených snímků je šestinásobný). Možná zajímavější částí ale bylo přidání dynamického režimu, který umožňuje počet generovaných snímků měnit za chodu podle aktuálního výkonu GPU. Celý článok „Dynamické generování snímků DLLS 4.5 vyjde za tři týdny“ »

Nvidia chystá GeForce RTX 5050 9GB. Vyšší kapacita s GDDR7?

Aktuální celosvětové problémy s cenami a dostupností pamětí vyvolané masivními plány na výstavbu AI datacenter nešetří ani oblast grafických karet. Je možné, že kvůli nim dokonce nevyjdou příští generace herních grafik v plánovaných termínech a Nvidia zrušila vydání plánovaných karet GeForce RTX 5000 „Super“, které měly dostat zlepšené kapacity. Ačkoliv jsou ale karty Super zrušené, jedna grafika s větší pamětí by mohla vyjít. Celý článok „Nvidia chystá GeForce RTX 5050 9GB. Vyšší kapacita s GDDR7?“ »

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *