AMD uvádí FSR 3. Otevřené generování snímků pro všechny grafiky

FSR 3 je už blízko, první hry už za měsíc

Minulý týden AMD na Gamescomu doplnilo sestavu grafických karet Radeon RX 7000 o dva nové modely RX 7700 XT a RX 7800 XT, ale současně s tím odhalilo i více softwarovou novinku – připravovanou technologii FSR 3 neboli FidelityFX Super Resolution 3, přinášející tzv. Fluid Motion Frames. Jde o otevřenou alternativu k technologii DLSS 3 od Nvidie, která bude fungovat na širším portfoliu GPU včetně těch starších.

AMD FSR 3 poprvé avizovalo už loni při oznámení grafik Radeon RX 7000, ale dlouho se čekalo na oznámení dostupnosti ve hrách a více detailů. To přišlo právě na Gamescomu, takže teď konečně máme víc jasno v tom, za jak dlouho se FSR 3 začne ve hrách objevovat, a už i první takové tituly.

FidelityFX Super Resolution 3, Fluid Motion Frames

Hlavní novinkou v FSR 3 je (stejně jako v DLSS 3) generování snímků v tom smyslu, že jsou vytvářeny nové snímky nad rámec toho, co vyprodukuje samotná hra. Tyto nové „generované“ snímky či mezisnímky vznikají interpolací ze snímků, které vykreslila a vypočítala hra. Jejich vygenerování je ale už na ní nezávislé. Celý koncept je víceméně totéž, co interpolace snímků či zvyšování snímkové frekvence videa v televizorech.

Funkce má označení AMD Fluid Motion Frames (AFMF) a je založená na technice optical flow, což by mělo znamenat, že jsou analyzována samotná vizuální data, aby byl zjištěn pohyb objektů mezi snímky a na základě něj byl zrekonstruován mezistav, který by měl být vidět v nově generovaném snímku. Vedle analýzy optical flow jsou současně používána „metadata“ jako pohybové vektory získané z enginu hry – stejně jako v FSR 2.x. Generování snímků pracuje současně s těmito dvěma kategoriemi informací.

Na tomto principu lze mezi dva reálné / vstupní snímky dogenerovat teoreticky i neomezené množství umělých mezisnímků, ale technologie FSR 3 (stejně jako DLSS 3 Nvidie) momentálně počítá s doplněním vždy jen jednoho. To má tu výhodu, že polovinu času jsou zobrazené reálné snímky, mezi nimiž vygenerované a potenciálně méně kvalitní mezisnímky jen probleskují. To poněkud zmírní viditelnost případných artefaktů.

Interpolace (generování) snímků by mělo být propojené s FSR 2.x, tedy upscalingem využívajícím temporální rekonstrukci a pohybové vektory, což by mělo celek zefektivnit. AMD také uvádí, že algoritmus generování snímků bude speciálně klást ohled na GUI hry a další elementy typu HUD, které nejsou přímo součástí scény. FSR 3 si má dávat pozor na to, aby je rušivě nedegradovalo.

Schéma fungování AMD FSR 3

FSR 3 poběží na prakticky všech grafikách

Podle tohoto popisu se zdá, že fungování FSR 3 je velmi podobné konkurenčnímu DLSS 3 (ono také není moc co vymýšlet, jde přístup už používaný po dlouhá léta v televizorech). Rozdíl je v tom, že Nvidia při analýze optical flow využívá specializované hardwarové jednotky přítomné v GPU generace Ada Lovelace, kdežto FSR 3 je napsané tak, že mu stačí obecný výpočetní hardware GPU.

DLSS 3 by tím mělo mít potenciál dosáhnout o něco lepší kvality, protože teoreticky má k dispozici více výkonu pro své výpočty. FSR bude mít asi omezenější „výpočetní rozpočet“. Také může mít o něco větší režii, takže nárůst výstupních FPS může být o něco menší – typicky asi často nebude dosahován dvojnásobek FPS, ale o něco méně.

Na druhou stranu FSR 3 díky použití jen standardních jednotek není omezené jen na vybraná GPU. Nejsou použité ani specifické akcelerátory AI, ani akcelerátory pro hledání pohybových vektorů / optical flow. Místo toho je použitý kód napsaný v HLSL (pro shadery). AMD již potvrdilo, že FSR 3 a jeho generování snímků bude fungovat na mnoha různých platformách včetně herních konzolí. Oficiálně je technologie podporovaná na kartách Radeon RX 5700 a novějších (doporučené jsou karty generace RX 6000 a 7000) u Nvidie na GeForce RTX 2000 a novějších (doporučeno RTX 3000).

Oficiálně podporovaná GPU pro AMD FidelityFX Super Resolution 3

Toto ale není nijak natvrdo omezeno a rozběhnete i starší grafiku, je vše bude pomalejší. Jediným reálným kritériem je, že GPU musí mít dost výkonu na hru samotnou a na běh algoritmů, které generují snímky navíc, aby věc byla v praxi užitečná. Ač tedy v tabulce podporovaných GPU není nic od Intelu, grafiky Arc budou jistě fungovat také.

Otevřená technologie

Podobně jako FSR 1.0FSR 2.x bude také tato technologie otevřená, včetně kódu, který tak bude možné studovat a zlepšovat. To pochopitleně platí i pro konkurenci – nevýhoda pro AMD je, že firma nemůže udržet nějaké speciální triky v tajnosti a Nvidia a / nebo Intel je vždy budou moci okopírovat do svých alternativ, které ale už takto otevřené nejsou. Kód bude zveřejněn ve FidelityFX SDK a na webu GPUOpen.

Horší latence

Nevýhody jsou stejné jako u DLSS 3 – vygenerované snímky navíc nereagují nijak na vstup hráče ani přímo nekorespondují s fyzikálními a AI výpočty hry. Jsou generovány čistě z finálního obrazu – tedy pixelů snímku plus pohybu, který je mezi snímky zjištěn analýzou tzv. „optical flow“ a z pohybových vektorů.

Generované snímky mohou vytvořit dojem větší plynulosti zejména ve chvíli, kdy se obraz pohybuje pomalu a plynule, ale při rychlém nepravidelném pohybu scény (nebo třeba když se obrazovka „zatřese“) mohou aproximovat chybně. Není tedy úplně správné mluvit o tom, že tyto techniky zlepšují plynulost her a „zvyšují FPS“, to platí jen za určitých podmínek. A dalo by se spíše říci, že vytváří více nebo méně úspěšnou iluzi plynulosti a vyšších FPS.

Zásadní komplikace je, že pro interpolaci mezisnímku potřebujete nejdřív mít k dispozici předchozí snímek i ten následující. Při použití FSR 3 i DLSS 3 tedy hra musí bufferovat o jeden snímek navíc, o což se prodlužuje latence (input lag) hry. Toto je z podstaty věci a děje se tak vždy. Nvidia se snažila tvrdit, že DLSS 3 latenci naopak zlepšuje na základě toho, že k němu přibaluje technologii Reflex. Ale toto je vyloženě zavádějící, protože technologie Reflex je nesouvisející a dá se použít bez DLSS 3 (až tehdy latenci minimalizuje). S generovanými snímky se děje to, že že toto zlepšení díky Reflexu padne za oběť tomu, aby kompenzovalo zhoršení latence inherentní v DLSS 3. Pokud se k Reflexu přidá interpolace snímků, vždy celková latence.

Propojení s Anti-Lag a nový Anti-Lag+

Podobnou technologii snižování latence AMD vyvinulo (ještě před Reflexem) pro potřeby soutěžního hraní pod označením AMD Anti-Lag a stejně tak bude párována s FSR, aby se dopad zhoršení latence zmírnil. S frafikami generace Radeon RX 7000 má být snížení latence ještě o něco zlepšeno pomocí nové vylepšené technologie Anti-Lag+, která má speciálně být upravená tak, aby dále snížila dopad při použití FSR 3.

Demo AMD FidelityFX Super Resolution 3 ve Forspoken

Obecně se kvůli latenci doporučuje generování snímků použít až tehdy, pokud hra bez něj běží okolo 60 FPS – čímž se dostanete někam na výsledných 100–120 FPS. V této situaci nebude dopad na latenci (a případná nepřirozenost pohybu) tolik vadit.

Pomoc pro hry limitované výkonem CPU

Bylo zmíněno, že generované snímky už vznikají nezávisle na samotných výpočtech a enginu hry. To má jeden zásadní důsledek – DLSS 3 či FSR 3 je mohou vytvořit i v situaci, kdy engine hry je limitovaný výkonem CPU a nestíhal by žádné další snímky připravit. V takové situaci vám už nepomůže DLSS 2.x nebo FSR 2.x, protože ty odlehčují jen zátěži GPU, ale práce pro CPU zůstává stejná. Některé hry tak i v nízkých rozlišeních mají pořád špatný výkon právě proto, že procesor nestíhá výpočet geometrie, AI a tak podobně.

Při použití DLSS 3 či teď FSR 3 se tento problém obejde a grafika v podstatě automaticky zdvojnásobí výstupní snímkovou frekvenci (byť s oněmi výhradami, o kterých byla před chvílí řeč). Příkladem takové hry je aktuální Microsoft Flight Simulator, kde prakticky nebylo možné dosáhnout dobrých FPS, kvůli enormní potřebě výkonu CPU dostanete vyšší snímkové frekvence právě jen pomocí generování snímků.

Zdvojnásobení snímkové frekvence pomocí generovaných snímků je možné dosáhnout i v situacích, kdy limitace existuje na straně GPU, tedy ve vysokých rozlišeních jako 4K, 5K, 8K. Tam je ale asi lepší nejprve sáhnout k FSR 2.x a DLSS 2.x a až pak generovat snímky.

První ochutnávka za měsíc?

Toto je alespoň teorie daná použitými postupy. Ale jak dobře bude FSR 3 fungovat, ukáží až hotové hry, ve kterých bude technologie zaintegrovaná, a testování v nich. Zejména to platí o vizuálním dopadu interpolace.

První hry s AMD FSR 3

První ohlášenou hrou s podporou FSR 3 a Fluid Motion Frames bude Forspoken od Square Enix a po ní Immortals of Aveum od Ascendant Studios / EA. Patche s podporou FSR 3 pro ně mají vyjít v záři či na začátku podzimu. Po těchto dvou je známo dalších deset her, které FSR 3 dostanou později, mezi nimi je například Cyberpunk 2077. AMD uvádí, že na podpoře ve hrách teď spolupracuje s 15 herními studii a další by měla přibýt.

Tituly, u kterých je oznámená podpora AMD FSR 3 (k srpnu 2023)

Zdroje: AMD (1, 2, 3, 4)

Jan Olšan, redaktor Cnews.cz


  •  
  •  
  •  
Flattr this!

Radeon RX 7900 GRE vychází globálně. S nižší cenou a víc modely

Do nabídky grafik Radeon se zařadí další model stojící mezi Radeonem RX 7800 XT a Radeonem RX 7900 XT. Do této mezery AMD loni ještě před vydáním samotného Radeonu RX 7800 XT pustilo Radeon RX 7900 GRE, který zpočátku vypadaly jako speciální model pro Čínu. Poté se ale stejně jako Ryzen 5 7500F začaly objevovat na běžném trhu. Teď to AMD celé zoficializovalo – Radeon RX 7900 GRE vychází globálně a s větším výběrem modelů. Celý článok „Radeon RX 7900 GRE vychází globálně. S nižší cenou a víc modely“ »

  •  
  •  
  •  

Zen 6 konečně přinese pokročilejší 2.5D čiplety, má RDNA 5 GPU

Zatím se objevilo jenom málo informací o tom, co přinesou procesory AMD Ryzen s architekturou Zen 6. Samotné jádro by mělo být evolucí Zenu 5, protože AMD používá cosi jako „tick-tock“ model, kdy sudé architektury jsou méně agresivní a rozvíjejí novinky uvedené v lichých. Ale vypadá to, že vše ostatní v SoC okolo jádra by naopak mohlo být docela radikální posun, který úplně změní stárnoucí koncepci „uncore“ u desktopových Ryzenů. Celý článok „Zen 6 konečně přinese pokročilejší 2.5D čiplety, má RDNA 5 GPU“ »

  •  
  •  
  •  

Microsoft zpřísnil požadavky Windows 11, už nepojedou na Core 2

Když vyšly Windows 11, měly poměrně striktní hardwarové požadavky například s povinným TPM2, což chvíli dělalo spoustě lidí vrásky. Oficiálně navíc podporují jen velmi omezený seznam nových procesorů s nejasnou hrozbou, že na starších nemusí například fungovat budoucí aktualizace. Nyní Microsoft potichu utáhl šrouby. Naštěstí ne tak, že by opravdu začal vymáhat tento seznam, ale systém přestane fungovat na řadě starších procesorů. Celý článok „Microsoft zpřísnil požadavky Windows 11, už nepojedou na Core 2“ »

  •  
  •  
  •  

Komentáre (4) Pridať komentár

  1. S využíváním specializovaných jednotek bych to neviděl tak horké. Abychom se jako v případě DLSS zpětně nedozvěděli, že patřičně využívány budou s odstupem dvou generací 😅

    1. Proč myslíš?
      Jak chceš řešit interpolaci obrazu, aby to za něco stálo jinak než přes hardware? Softwarové řešení ti nikdy nebude poskytovat stejnou hodnotu, ale bude náročnější na výkon a pomalejší.
      Takže NVidia to jede přes hardwarové jednotky od začátku RTX 2000, AMD na to nabíhá také s RX 7000 řadou, ne jinak tomu bude u Intelu. A protože to každá firma bude vidět jako konkurenční výhodu, nebude to vzájemně kompatibilní. Navíc to grafiku bude prodražovat.
      Celé je to nesmysl a jen důsledek toho, že výkon grafik stoupá stále menším tempem, protože se prostě nedaří vyvinout vyšší výkon v rámci současných technologií a na nějakou revoluci zatím nikdo nepřišel.

      Místo výkonu obchcávky, to jsme to dopracovali!

      1. No není to tak horké ani u Nvidie, jakkoli je tím notoricky proslulé AMD. Člověk mohl snadno nabýt dojmu, že denoising při raytracingu prováděly tensorové jednotky s využitím strojového učení už od počátku, ale museli jsme si na to léta počkat.

        Na obechcávkách je z gruntu postavená veškerá herní grafika, co je svět světem. Tyhle nářky nechápu.

        1. To máš sice pravdu, ale doteď to bylo jasně účelné, třeba antialiasing. U DLSS je to něco za něco. Jednoduše hráč, který použil antialiasing viděl úplně stejnou scénu jako hráč, který ho nepoužil, akorát ten první to měl víc vyhlazené a mizely ostré hrany. U DLSS může být v nějakém mezním bodě situace až tak kritická, že to může část scény úplně změnit.
          Mně se to nelíbí, používat to nebudu a nevidím to jako přínos.
          Protože se nám navýšilo rozlišení obrazovek víc než dokázal stoupet výkon grafik, došlo k situaci, že máme 4K obrazovku, ale grafika 4K nedokáže zpracovat.
          Můžeš si zvolit dva přístupy. Buď vezmeš 1080p obraz a interpoluješ ho pomocí grafické karty na 4K (například DLSS) nebo si jednoduše spustíš hru na 1080p a interpolaci necháš na monitoru a žádný výkon na to nepotřebuješ. 🙂
          Preferoval bych druhé mnohem jednodušší a nenáročné řešení. Má to háček, čím dál víc monitorů takovouto interpolací mrví obraz. Ty monitory tam také provádějí výpočty, přitom 4K versus 1080p je 4:1 a jeden pixel nahradíš čtvercem 4 pixelů. Ty pixely jsou přitom tak malé, že v pohyblivém videu většinou ani 4 pixely místo jednoho ve čtverci nerozpoznáš a považoval bys celý čtverec 4 pixelů vizuálně za jeden.
          To všechno, kdyby to monitor nezmrvil. Místo, aby byli výrobci monitorů klepnuti přes prsty, nemrvte to! Tak se vymýšlí technologie, jak to celé provést na grafice, ach jo. :-/

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *