Rozbor GPU Ampere: co je nového v architektuře GeForce RTX 3000

Nový výrobní proces 8N: technologie Samsungu vylepšená speciálně pro Nvidii

Po stránce hardwaru byl tento měsíc obrazně řečeno celý zelený díky vydání nové generace grafických karet Nvidia, GeForce RTX 3000. Ty jsou založené na nové architektuře Ampere. Co přináší a v čem je nová proti Turingu, probereme v tomto článku: novou architekturu SM stojící za dvojnásobnými počty shaderů nebo výrobní proces nebo charakteristicky obou čipů, které zatím byly odhaleny.

Vše nové: proces, architektura i paměti a konektivita

Ampere je po všech stránkách nová generace GPU. Spojuje trojici inovací: nový výrobní proces, novou architekturu samotných bloků a výpočetních jednotek GPU, ale tentokrát rovnou i novou technologii pamětí GDDR6X, lišící se od předchozích využitím efektivnější signalizace PAM4. Té jsme se ovšem již věnovali samostatně zde.

Výrobní proces: speciální upravená technologie 8N

Už poměrně dlouho se objevovaly informace, že Nvidia začne GPU vyrábět u Samsungu místo u TSMC, které je nejetablovanější ze zakázkových „Foundry“ továren. Nvidia již používala 14nm proces Samsungu (14LPP) pro některé méně výkonné čipy Pascal (GP107 v GeForce GTX 1050/1050 Ti). Když se tedy už loni objevily zprávy, že Nvidia pro čipy příští generace použije proces Samsungu, uvažovalo se nejdřív, že půjde o něco podobného.

Nakonec je v generaci Ampere situace jiná. Nvidia vyrábí u Samsungu nejvýkonnější modely GPU, GA102 a GA104, jen výpočetní GA100 pro servery je vyráběn na 7nm procesu TSMC. Herní Ampere je ale specifické nejen tím, že je od Samsungu, ale také tím, že není 7nm. Nvidia zvolila starší technologii Samsungu, tzv. 8nm proces, jenž je vylepšeným derivátem 10nm generace.

Slajd, kde Nvidia oznamuje použití 8nm procesu 8N

Proces se označuje 8N, protože je specificky určený pro Nvidii a měl by obsahovat různá neupřesněná vylepšení a úpravy pro její potřeby. Mělo by jít tedy o lepší technologii než je proces 8LPP, který používají některé mobily, podle některých informací úpravy pro Nvidii mají za výsledek až o 10 % vyšší výkon (čímž se myslí vyšší dosažená frekvence) než původní verze procesu zaměřená spíše na mobilní SOC. Ovšem tento proces dosahuje pravděpodobně nižší energetickou efektivitu a hustotu tranzistorů než reálný 7nm proces, jenž je už u Samsungu založený na EUV litografii. Pravděpodobně jsou vlastnosti také o něco méně dobré než u 7nm procesu TSMC.

Nvidia sice uvádí v marketingových materiálech až 1,9× nárůst energetické efektivity, ale to je značně přehnané. Ve srovnání výkonů a spotřeb pro grafiku GeForce RTX 3080/3090 při hraní vychází výrazně horší faktory (cca 1,1–1,3× podle okolností). Ovšem pozor – pokud by Nvidia nastavila stejná TDP jako u Turingu, vycházela by asi efektivita výrazně lépe (jen by výkon byl nižší). Konkrétní číslo závisí na tom, jak agresivně jsou taktované srovnávané čipy, takže nelze říct, jaký je mezi Turingem a Ampere faktor obecně.

Slajd, kde Nvidia tvrdí, že Ampere má 1,9× energetickou efektivitu. Jde však zdá se o srovnání podtaktovaného GA102 s TU102 na standardním taktu, což je v praxi nerealistické

Proces je každopádně jen implementační detail, který pro uživatele není přímo důležitý, pro nás budou rozhodovat až finální výsledky. 8nm proces je ostatně také pořád generační posun proti 12nm technologii používané v Turingu (12nm proces TSMC je derivát jeho 16nm technologie použité v GPU Pascal).

Další informace: Parametry, ceny, výkon karet Nvidia GeForce RTX 3090, 3080 a 3070

Je možné, že Nvidia původně počítala s o něco vyšší energetickou efektivitou, protože GPU Ampere na procesu 8N mají nezvykle vysoká TDP (GeForce RTX 3080 320 W, RTX 3090 rovnou 350 W). Je teoreticky možné, že spotřeba vyšla vyšší než plánovaná, ale to nevíme – Nvidia klidně mohla na vyšší spotřeby cílit od počátku.

GPU GA102,verze z GeForce RTX 3080 (Zdroj: techPowerUp)

Volba 8nm procesu byla prakticky určitě vědomá, nejde asi o to, že by pro Ampere nezbývaly 7nm kapacity a 8nm proces byl „nouzové řešení“. Nvidia pravděpodobně použila 8nm technologii proto, že GPU s ní stojí výrazně méně na výrobu, i když se započte jejich vyšší plocha. Podobné to bylo i s volbou 12nm procesu u Turingu. To, že Nvidia zvolila Samsung místo TSMC, nejspíš přineslo další úsporu, protože Samsung se snaží pro svůj Foundry byznys agresivně získat klienty a nabídl pravděpodobně štědrou slevu, zatímco TSMC má dalších klientů dost a nemělo motivaci snížit si marži podobně nízkou cenou.

Výsledkem každopádně je, že karty Ampere budou po stránce GPU (ale ne nutně po stránce PCB, VRM a pamětí) relativně levné na výrobu, což bude důležité v konkurenčním boji se 7nm Radeony (jejichž čipy jsou asi i při menší ploše dražší).


  •  
  •  
  •  
Flattr this!

GeForce RTX 5000 nebudou 3nm, mají stejný 4nm proces jako B200

Odvolávám, co jsem odvolal, a slibuji, co jsem slíbil. Tak nějak je to nyní s grafikami GeForce RTX 5000 a informacemi, které o nich neoficiálně prosakují (ty oficiální budou až za rok). Původně jsme pracovali se zprávami, že herní GPU Blackwell, na kterých budou příští herní grafiky Nvidie založené, budou 4nm čipy, ale před časem to začalo vypadat na 3nm proces, což by bylo pozitivum. Ovšem odhalení výpočetní verze B200 věci zase změnilo… Celý článok „GeForce RTX 5000 nebudou 3nm, mají stejný 4nm proces jako B200“ »

  •  
  •  
  •  

Na GeForce RTX 2000 a GTX 1600 se dá zapnout ReBAR modem UEFI

Objevila se docela zajímavá zpráva. Pomocí modifikace se podařilo rozběhnout funkci PCI Express Resizable BAR (či ReBAR) na grafikách Nvidia generace Turing (GeForce RTX 2000 a GTX 1600), které ji normálně nepodporují. Můžete si na nich tak o něco zlepšit výkon ve hrách. Je to však docela komplikovaný hack, a ačkoliv je to technicky zajímavá věc, nelze ho úplně doporučit, pokud nejste experti, které nerozhodí „bricknutá“ deska. Celý článok „Na GeForce RTX 2000 a GTX 1600 se dá zapnout ReBAR modem UEFI“ »

  •  
  •  
  •  

GeForce RTX 5090 nakonec s 512bitovou pamětí, GB203 má 96 SM

Minulý týden se dostaly ven informace o 28GHz pamětech na grafikách GeForce generace RTX 5000. Byla to ale jen předehra, leaker Kopite7kimi poté přidal podrobnější pohled na specifikace chystaných herních GPU generace Blackwell. Zdá se, že to bude větší výkonnostní skok. Tak trochu v duchu citátu „odvolávám, co jsem odvolal“ je totiž zpět ve hře 512bitová sběrnice, s níž by Blackwell byl nejtěžší kalibr Nvidie za dlouhou dobu. Celý článok „GeForce RTX 5090 nakonec s 512bitovou pamětí, GB203 má 96 SM“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *