8nm grafiky Nvidia GeForce RTX 3000 s architekturou Ampere ficiálně představeny
Dva roky po Turingu nastal čas, kdy Nvidia opět má novou generaci grafik: GeForce RTX 3000. Jejich architektura Ampere má překvapivé změny a také bude velmi rychlá. Včera byly odhalené první tři modely RTX 3090, RTX 3080 a RTX 3070, takže už známe ceny, data vydání a přibližně i výkon. V highendu sice hodně stoupla cena, ale nižší dva modely naopak přinesou spoustu výkonu navíc za stejné peníze.
Čipy Ampere jsou zatím zřejmě vydané dva – GA102 v GeForce RTX 3090 a RTX 3080 a GA104 v levnější RTX 3070. Podle informací přímo od Nvidie jsou vyrobené na 8nm procesu Samsungu, jak uváděly neoficiální úniky. Proces je označen „8N“ a má být speciálně upravený pro potřeby Nvidie.
Architektura Ampere má vylepšenou architekturu RT jader druhé generace pro ray tracing, která nicméně asi fungují obdobně jako u Turingu (mají mít ale celkově až 2× výkon pro výpočty průsečíků paprsků s objekty scény) a také třetí generaci Tensor jader pro výpočty umělé inteligence, respektive neuronových sítí. Ta jsou přejatá z výpočetní verze Ampere a měla by mít dvojnásobný výkon v FP16 maticových operacích a také podporovat techniku Structured Sparsity pro další urychlení.
Ampere také používá jako vůbec první GPU úplně nové paměti GDDR6X se signalizací PAM4, o kterých jsme podrobně psali zde.
Překvapení: dvojnásobek FP32 shaderů = dvojnásobné TFLOPS
Ovšem asi nejzásadnější architektonická změna (Nvidia pravda ještě neodhalila detaily, takže se ještě možná dozvíme další překvapení) je v shaderech, tedy klasických výpočetních jednotkách. Nvidia včera odhalila, že zdvojnásobila výkon FP32 ALU, tedy základních výpočetních jednotek shaderu.
GPU Turing a Volta měla v jednom bloku SMD 64 shaderů, ovšem kromě jednotek FP32 byla ke každé přidána ještě separátní jednotka INT32, schopná zpracovat paralelně celočíselné operace. Vypadá to, že v Ampere byla přidána ještě jedna další jednotka FP32. Není úplně jasné, jak je to architektonicky řešeno, ale efektivně má teď jeden blok zřejmě 128 (FP32) shaderů.
Toto do poslední chvíle Nvidia tajila, takže výrobci karet zprvu měli v materiálech uvedeny poloviční počty jednotek, které jsme také viděli v únicích. Realita je nakonec dvojnásobná a Ampere tak má dvojnásobný teoretický výkon v TFLOPS (v FP32), než bylo původně předpokládáno. Reálně ve hrách asi přidání druhé FP32 jednotky nebude vést ke 100% zrychlení (kvůli úzkým hrdlům výkonu jinde), ale toto posílení je částečně zdrojem nárůstu výkonu grafik GeForce RTX 3000.
GeForce RTX 3090
A teď už k jednotlivým modelům. Vrcholem nabídky je grafika GeForce RTX 3090. Tato karta má čip GA102 (zřejmě, Nvidia jména nepotvrdila) se 10496 stream procesory/shadery/Cuda jádry – přičemž toto dost možná pořád není plná konfigurace. Nataktováno je GPU na 1,40 GHz v základu a frekvence Boostu je stanovená na 1,70 GHz. Zda bude opět běžné, že GPU ve hrách poběží na ještě vyšším taktu, než je udaný Boost, to zatím těžko říct, přece jen asi zdvojení shaderů může mít zatěžující efekt na spotřebu. Počty rasterizačních a texturovaních jednotek jakož i RT jader a tensor jader nebo L2 cache zatím Nvidia neprozradila.
Karta bude mít osazeno 24 GB paměti GDDR6X, ta je na 384bitové sběrnici. Díky použití GDDR6X byla efektivní frekvence zvýšená na 19,5 GHz, což dodává propustnost 936 GB/s. Karta nese 24 čipů GDDR6X, které tak budou po obou stranách PCB.
Teoretický hrubý výkon je 35,7 TFLOPS ve výpočtech se standardní přesností (FP32). Výkon RT jader má odpovídat až 69 TFLOPS, pokud by se na stejnou práci musely použít shadery. Výkon AI akcelerátorů Tensor Core je 285 TFLOPS (v FP16).
Spotřeba celé karty/TDP je 350 W, jak už hrozily úniky. Nereferenční karty budou zdá se většinou chladit pomocí tří ventilátorů a tříslotového chladiče, napájení mají dvěma nebo někdy volitelně třemi osmipiny.
Nvidia použije u svých karet Founders Edition nezvyklý chladič, který jsme již viděli v únicích – ten má velmi krátké vykrojené PCB (kde jsou paměti a VRM hodně namačkané na GPU) a napájení dvanáctipinovým konektorem Nvidie. Chladič má jeden ventilátor zespodu, jenž by měl tlačit vzduch do pasivu a poté ven záslepkou ze skříně (část ho asi ale zůstane uvnitř), druhý je ale na horní straně karty. Ten je obrácený a vzduch přes pasiv nasává, takže také fouká směrem vzhůru. Bude tak vytahovat teplo zpod karty nahoru k procesoru, kde ho mohou odvést skříňové ventilátory. Podobné profukovací okno mají i některé nereferenční karty s ventilátorem dole – toto ostatně není zcela nový nápad, byl už na některých Radeonech R9 Fury z roku 2015.
Jen RTX 3090 bude podporovat NVLink SLI (má jeden konektor), na levnějších kartách už toto nebude umožněno. Můstek bude asi nutno koupit nový (opět stojí 79 $), konektor se údajně změnil.
Výkon, cena, datum:
Nvidia už potvrdila, že tato karta se začne prodávat 24. září/septembra, a to za 1499 $. Cena v eurech je momentálně (díky slabému dolaru…) stanovena na 1499 €, oficiální cena pro ČR je 40 999 Kč.
Jaký bude přesně výkon karty, zatím víme jen orientačně z oficiálních benchmarků. Ty mohou být selektivní, takže finální úsudek si raději udělejte až když vyjdou nezávislé recenze. Sama Nvidia ale uvádí, že karta má být 1,5× rychlejší než Titan RTX, a tedy ještě o něco více rychlejší proti GeFore RTX 2080 Ti. Toto by měly být údaje pro hry s ray tracingovými efekty a s použitím DLSS. Podle Nvidie podává Ampere tím vyšší výkonnostní zlepšení proti Turingu, čím více ray tracingu je ve hře. V běžných rasterizačních hrách tedy asi může být nárůst výkonu o něco menší (ale opět, počkejte na recenze).
GeForce RTX 3080
Na stejném základu, tedy stejném PCB a čipu GA102, jenž ovšem bude ořezaný, je založený i druhý model RTX 3080. U něj ztratilo GPU asi 16 % jednotek a má 8704 shaderů. Takt je mírně vyšší, 1,44 GHz v základu a takt boostu je uvedený 1,71 GHz. TDP karty je už nižší, ale ne o moc – 320 W.
Toto mírné snížení spotřeby je možná dáno zmenšenou pamětí. Tato karta má jen 10GB paměť. Pořád je to GDDR6X, ale s drobně redukovaným taktem 19,0 GHz efektivně. Kvůli jen 10 čipům je sběrnice 320bitová a výsledkem je propustnost paměti 760 GB/s.
Teoretický hrubý výkon je 29,8 TFLOPS ve výpočtech se standardní přesností (FP32). Výkon RT jader má odpovídat až 58 TFLOPS, pokud by se na stejnou práci s hledáním průsečíků musely použít shadery. Výkon AI akcelerátorů Tensor Core je 238 TFLOPS (v FP16).
I tato karta se napájí dvěma osmipiny a obvykle se asi bude prodávat se stejným chladičem a provedením jako RTX 3090. Karta Founders Edition přímo od Nvidie v tomto ale bude výjimka, její chladič je zmenšený, i když funguje na stejném principu a PCB asi je také identické.
Výkon, cena, datum:
Zatímco předchozí model byl o dost zdražen proti tomu, co před ním Nvidia chtěla za GeForce RTX 2080 Ti (jejíž náhradou by měl být, byť někteří lidé v ní kvůli velké paměti vidí nástupce Titanu), zde tomu tak není. Nvidia naopak zachovala ceny, které měly karty Turing – u kterých pravda byla cena zvýšená a kritizovaná. GeForce RTX 3080 tak oficiálně bude začínat na ceně 699 $, u nás 699 € nebo 18 999 Kč. A start prodeje je již 17. září/septembra – tento Ampere bude první model, jenž přijde na trh.
Podle Nvidia je GeForce RTX 3080 až dvakrát výkonnější než GeForce RTX 2080, což je při stejné uváděcí ceně hodně pěkné (minimálně reparát za Turing, kde poměr cena/výkon ze začátku byl stejný ne-li horší než u Pascalu). Opět platí, že jde o skóre ve hrách s ray tracingem a DLSS, na internetu se objevilo video od Digital Foundry, kde v různých hrách podává RTX 3080 výkon vyšší jen o hodnoty do 80 % nebo okolo. Oficiální benchmarky holt mohou být selektivní, opět si proto počkejte na recenze a suďte až pak.
GeForce RTX 3070
Třetí model, jenž už bude v dostupnějším mainstreamovém pásmu, je už údajně založený na odlišných PCB a čipu GA104 (opět to ale ještě Nvidia sama nepotvrdila). U této karty bude čip mít aktivních 5888 shaderů. Základní takt bude 1,50 GHz, takt boostu 1,73 GHz. TDP je zde výrazně nižší, již jen 220 W.
U této karty Nvidia již nepoužívá paměti GDDR6X, nýbrž jen běžnou GDDR6. Ta ale běží na vyšším taktu 16,0 GHz efektivně, zatímco u Turingů byly typicky takty jen 14,0 GHz. Aktualizováno: takt pamětí je u této karty nakonec pořád jenom 14,0 GHz. Sběrnice je 256bitová, takže GPU bude dostávat propustnost 448 GB/s. A kapacita je 8 GB.
Teoretický hrubý výkon je 20,4 TFLOPS ve výpočtech se standardní přesností (FP32). Výkon RT jader má odpovídat až 40 TFLOPS, pokud by se na stejnou práci s hledáním průsečíků musely použít shadery. Výkon AI akcelerátorů Tensor Core je 163 TFLOPS (v FP16). Hrubý výkon je tedy asi 57 % RTX 3090 (za třetinu ceny, jak hned uvidíte…).
Tato karta už by se měla typicky napájet jen jedním osmipinem (ale snad dvanáctipinem u Nvidia Founders Edition). Chladiče většinou budou dvouventilátorové. Provedení Founders Edition má v tomto případě už oba ventilátory dole, ale zůstalo profukovací okno na konci karty.
Výkon, cena, datum:
Také zde je cena nezměněná proti generaci Turing, což jistě uvítáte: 499 $, u nás oficiálně 499 € nebo v ČR 13 999 Kč. Kdy přesně karta půjde na trh, není zatím přesně řečeno, jen že to bude někdy v příštím měsíci (říjen/október). Nejspíš asi v jeho první polovině nebo úplně na začátku.
Nvidia u této karty uvádí, že výkon (opět asi v ray tracingu/DLSS) je o 60 % vyšší než u původní RTX 2070 (proti RTX 2070 Super by to mohl pořád být rozdíl 40–50 %). Údajně má také karta být rychlejší než předchozí highend RTX 2080 Ti (ale opět, počkejme si na recenze, zda to třeba není jen ve výběrové menšině her). Opět to ale bude zřejmě významné zlepšení v poměru cena/výkon, stejně jako u RTX 3080 (a ne moc u RTX 3090).
HDMI 2.1, AV1, RTX IO a další novinky
Karty Ampere mají kromě předešlého i další novinky, z nichž vše ještě Nvidia ještě asi ani neodhalila a budeme si muset počkat na detaily k architektuře. Víme ale již, že GPU podporují rozlišení 8K a výstup HDMI 2.1 (DisplayPort zůstal). Také již mají hardwarový dekodér videa ve formátu AV1, který má podporovat dekódování až v rozlišení 8K a také HDR obraz.
Nvidia také integrovala hardwarovou dekompresi textur RTX IO (snad by měla být standardizovaná/kompatibilní s funkcí DirectStorage v DirectX), která umožní přímé streamování textur z SSD do paměti GPU, s vysokou propustností a malou zátěží pro CPU. A v neposlední řadě také tato GPU již podporují PCI Express 4.0 pro připojení do systému, takže se využijí platformy X570/B550 u AMD a případně příští rok Intel Z590/Z490 s procesory Rocket Lake.
>> „kde v různých hrách podává RTX 3080 výkon vyšší jen o hodnoty do 80 % nebo okolo.“
Ve videu Digital Foundry podává karta i více než 90% nárůst výkonu, třeba v DOOM Eternal, viz https://youtu.be/cWD01yUQdVA?t=530
Digital Foundry patrně vycházejí z těchto materiálů Nvidie, ze kterých je patrný spíše menší nárůst (od oka při zohlednění TGP a celkové efektivity optimisticky o 40%). Pokud teda nepromujeme s ještě větší urputností, než kdyby nás za to platili.
To zkrácené (zhuštěné) PCB i v případě 3070 vypadá zajímavě, skoro určitě pro nadšence vodního chlazení. Snad bych se i nechal přesvědčit, jestli je návrh při dispozici chladiče (VRAM, VRM) celkově vyladěný (TDP je tady designu patřičné). Jestli se chystá 16GB verze, nebude o čem!