Je RDNA 3 to samé co RDNA 2? Omyl, ukazují výpočetní testy

Rozdíl mezi RDNA 3 a RDNA 2 se asi podceňuje

Teprve dokončujeme recenzi Radeonu RX 7600 (v provedení Pulse od Sapphire), ale vyrobili jsme malé preview, které vám ukážeme už teď. Týká se jedné dílčí oblasti, která by se v celé recenzi asi dala i snadno přehlédnout, totiž testů této grafiky ve výpočetních aplikacích. Vypadá to, že v nich nová karta vykazuje lepší než typické nárůsty výkonu. Objevily se názory, že GPU Navi 33 nepřineslo nic nového prosti čipu Navi 23, ale tady to vypadá na opak.

Při procházení výsledků ze stovek testů, které máme v testech v grafech, jsme si všimli, že v porovnání s tím, jaké výsledky má Radeon RX 7600 typicky ve hrách (o tom už v kompletní recenzi), vyházejí překvapivě vysoké nárůsty výkonu v některých – i když také ne všech – výpočetních aplikacích. Tím nemyslíme, že by tato levná karta najednou nějak drtila GeForce RTX 4090 nebo něco podobného, ale na procenta tato zlepšení proti předchozí kartám s Navi 23 (například Radeonu RX 6650 XT) vycházejí jednoduše příznivější než ve hrách.

Nemáme žádnou exaktní analýzu, která by to vysvětlovala s jistotou, ale nejvíce se nabízí to vysvětlení, že tímto o sobě dává vědět právě nová architektura RDNA 3 a změny, který v ní jsou proti architektuře RDNA 2 nacházející se v kartách s čipem Navi 23 (Radeon RX 6650 XT, RX 6600 XT…). Věnovali jsme se jim už zde.

Výpočetní jednotky CU (Compute Unit) architektury RDNA 3 jsou výrazně přepracované. Od prvních GPU architektury GCN téměř před 11 lety měl blok GPU vždy 64 shaderů („ALU“). RDNA 3 přináší u SIMD jednotek, které poskytují ony „shadery“, poprvé schopnost zpracovávat dvě instrukce za jeden cyklus. Stejně jako u RDNA 2 jsou na to použité dvě 32-wide SIMD jednotky, ale se schopností „dual issue“, tedy zpracovat současně dvě instrukce. Mají tím teoretický výpočetní výkon až jako 128 shaderů místo dosavadních 64.

Nicméně toto zdvojení „ALU“ či shaderů je provedeno v rámci struktury CU vycházející z předchozích generací, takže 64 těchto dual-issue shaderů, které by teoreticky mohly konat práci 128, sdílí některé řídicí a výpočetní struktury, které u RDNA 2 obsluhovaly jen 64 shaderů. A hlavně je tato schopnost dual-issue zatím poměrně nepružná a má různá komplikované omezení a požadavky na instrukce, které mohou být vykonány zároveň. Proto 64 těchto shaderů RDNA 3 tedy v praxi má o dost menší váhu relativně k výslednému výkonu, než by mělo 128 shaderů RDNA 2. Sice se tedy zdvojnásobuje počet TFLOPS, které GPU s dual-issue může teoreticky počítat, ale v praxi z nich bude vytěženo mnohem méně – obvykle.

Ve hrách se zatím přínos této architektonické změny projevuje dost málo, jak je vidět na herních testech, kde se „IPC“ (čili výkon GPU na jeden shader a 1 MHz) zdá se u RDNA 3 o moc nezvedlo. Pro ovladače AMD je evidentně obtížné ve hrách, které mají velké množství různých shaderů, dual-issue nějak častěji uplatňovat.

Relativně lepší výsledky Radeonu RX 7600 ve výpočetních aplikacích by ale mohly ukazovat, že takovéto programy jsou schopné dual-issue využít častěji. Může to být proto, že nemají tolik různorodého kódu, takže například hlavní algoritmy a smyčky Blenderu je snadnější optimalizovat tak, aby se některé instrukce zpracovávaly v režimu dual-issue.

Nadprůměrné nárůsty výkonu s architekturou RDNA 3 v našich testech jsou nejspíš doklad toho, že alespoň v některých případech se dual-issue už ve výpočetních aplikacích uplatňuje. Je tu jeden důvod, který tuto myšlenku podporuje. Analogická situace byla totiž s architekturou Ampere od Nvidie. Také ta zdvojnásobila počet FP32 shaderů, i když technické detaily se lišily. I tehdy ale reálný přínos ve hrách byl poměrně omezený a ani zdaleka nedocházelo ke zdvojnásobení výkonu. A snad podobně dnešní situaci se i tam přínos projevil mnohem výrazněji v některých výpočetních aplikacích než ve hrách. Na velké nárůsty výkonu v různých testech Cuda a OpenCL aplikacích si možná ještě vzpomenete. Toto tedy ukazuje na odlišný charakter výpočetních aplikací v porovnání s hrami, který možná stojí i za atypickými výkonnostními nárůst ve výpočetních aplikací na architektuře RDNA 3 v Radeonu RX 7600 a čipu Navi 33.

Berte to tedy tak, že architektura RDNA 3 / Navi 33 může mít určitý potenciál navíc proti RDNA 2 a Navi 23, takže se rozhodně nedá říct, že by mezi starším a novějším čipem bylo prašť nebo uhoď, který budete mít. Výsledky výpočetních aplikací mohou také ukazovat na určitý zatím nevyužitý potenciál, který by přece jenom časem mohl prosakovat i do těch her.

Možná by tedy i u RDNA 3 mohlo trochu dojít na onu často citovanou průpovídku, že ovladače zrají jako víno. Neberte to tak, že by GPU udělalo třeba za rok, za dva nějaký extrémní skok. Ale pozvolné zlepšování výkonu (konzervativně si přestavme třeba 5–10 %?), o které by si RDNA 3 časem polepšila v porovnání s výkonem u RDNA 2, by mohlo být docela realistické. Zaručit vám to ale samozřejmě nemůžeme.

Teď už tedy jen bez dalšího komentáře některé z relevantních grafů, které budou v celé recenzi, a přišly nám zajímavé.




Zdroje: vlastní

Jan Olšan, redaktor Cnews.cz



  •  
  •  
  •  
Flattr this!

Zen 5: Nejinovativnější jádro AMD od původního Zenu [rozbor]

Jsou to zhruba dva týdny do vydání procesorů AMD s novou architekturou Zen 5. Tento týden jsme se k těmto CPU dozvěděli konečně pořádné podrobnosti o jejich samotné architektuře, které AMD zveřejnilo na akci Tech Day. Už tedy můžeme rozebrat změny, které firma udělala v jádru oproti Zenu 4 – a že jsou hodně rozsáhlé, asi více, než se v červnu zdálo. A firma také zopakovala příslib 16% zvýšení IPC u těchto procesorů. Celý článok „Zen 5: Nejinovativnější jádro AMD od původního Zenu [rozbor]“ »

  •  
  •  
  •  

Ryzeny 9000 mají vyšší maximální takt, než je oficiální boost

AMD už na Computexu 2024 začátkem června oznámilo parametry procesorů Ryzen 9000, což jsou desktopové procesory s novou architekturou Zen 5 pro socket AM5 včetně frekvencí. Maximální takty u nejvýkonnějšího modelu jsou nakonec přesně stejné jako u Zenu 4 (5,7 GHz u Ryzenu 7950X), ale to ještě nebyla úplně konečná odpověď. Jako v předchozích generacích je totiž maximální takt ve skutečnosti vyšší než oficiální číslo. Celý článok „Ryzeny 9000 mají vyšší maximální takt, než je oficiální boost“ »

  •  
  •  
  •  

„Všetky“ grafické karty v analýze hlučnosti cievok

Počet otestovaných grafických kariet za uplynulé obdobie sa dostal na číslo 30, po ktorom sa môžeme trochu zastaviť a špeciálne sa zamerať na hlučnosť cievok. Tá bola v rámci štandardných meraní zaznamenávaná vždy, ale vo veľkých testoch s kopou iných informácií, sa tieto unikátne údaje strácali. Aj preto to bude teraz, v rámci tohto článku iba k nim. Ktorá z moderných grafických kariet má teda tichšie cievky? Celý článok „„Všetky“ grafické karty v analýze hlučnosti cievok“ »

  •  
  •  
  •  

Komentáre (3) Pridať komentár

  1. Pro zajímavost pěkné, ale takový uživatel bude mít zřídka až povážlivě hluboko do kapsy. Vedle plnotučné 4060Ti je to takový věchýtek zralý na podpal. Možná kdyby neustoupili ze standardu pro displayport (že by taky kvůli Matroxu?).

    1. Jasné, ale RTX 4060 Ti je o 70 % drahšia a pritom sú prípady, v ktorých má RX 7600 vyšší aplikačný výkon. Samozrjeme, platí to aj opačne, ale atraktívnejší pomer cena/výkon si Radeon často udrží i tak. Napriek tomu, že podstatne viac zákazníkov týchto kariet zaujíma herný výkon, tak by sa asi nemali prehliadať ani tieto zmeny a zlepšenia. Určite nie do takej miery, že o nich nikto nereferuje.

      1. Ty případy jsou spíše sporadické a v případě použití s Catia až anekdotické. To musíte uznat, Ľubo. Je to zajímavé, ale vedle podpory CUDA s 12 GB paměti je to spíše pro zasmání. 4060Ti v plné palbě bude aplikační karta pro chudé a cenu si z téhle perspektivy obhájí.

        Taky si myslím, že pro hráče je to dobrá karta. A možná se další změny v architektuře zhodnotí s příchodem nové verze FSR.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *