AMD FSR: nové hry a informace, algoritmus Lanczos, využívá FP16

AMD FSR už je open-source, vyšly podpora v dalších hrách, demo a nové informace

Když byla minulý měsíc do světa vypuštěná technologie upscalování her FidelityFX Super Resolution (FSR) od AMD, bylo přislíbeno, že to bude open source software. To také bylo dodrženo, AMD teď publikovalo FSR na webu GPUOpen. Díky tomu máme víc informací k tomu, jak upscaling funguje. Také byly oznámeny další hry, do kterých se FSR dostane, a demo, kde se technika dá zkoušet.

Minulý týden AMD zveřejnilo kód FSR na svém webu GPUOpen, kde sdílí open source grafické komponenty pro hry a další software. To jednak usnadní integraci do her včetně toho, že teď budou vývojáři moci kód upravovat (je pod licencí MIT). Kromě toho jsme s tím ale také získali nové poznatky o fungování této technologie.

První část filtru tvoří upravený Lanczos + anti-ringing

Z kódu vyplynulo, jaký algoritmus používá FSR k zvětšení rozlišení snímků. AMD ho nazývá Edge Adaptive Spatial Upsampling (EASU), přičemž vedle něj FSR aplikuje ostření nazvané RCAS (Robust Constrast-Adaptive Sharpening), EASU tedy není celé FSR.

Zařazení FSR do pipeline vykreslování hry

AMD uvádí, že EASU používá upravený škálovací (převzorkovávací) algoritmus, který je aproximací algoritmu Lanczos s velikostí kernelu 2. O aproximaci jde proto, že je jednak upravený (zjednodušený) pro výkon tak, aby výpočetní nároky byly co nejnižší (neobsahuje žádné komplexní operace jako sin, výpočet převrácené hodnoty nebo odmocniny), což má umožnit použití FSR i v nevýkonných levných notebookových a jiných lowendových grafikách.

Komentář v kódu popisující použitý upscalovací algoritmus (Zdroj: TechPowerUp)

Druhá modifikace přidává jednoduchou pojistku proti vzniku „ringing“ artefaktů (nebo také „haloing“), které klasický Lanczos produkuje. Algoritmus hodnotu výstupního pixelu omezí do rozsahu hodnot, který zjistí v okolí pixelu, přičemž jako toto okolí používá blok 2×2 vstupních texelů. Toto omezení vypočteného pixelu zajistí, aby nepřestřeloval (nebyl jasnější nebo tmavší), což by právě mělo zabránit ringingu. Jde tedy asi o něco podobného, jako anti-ringing pro škálování Lanczos, který používá MadVR.

Kód jinak uvádí, že celé škálování probíhá jedním průchodem, což je změna proti obvyklému postupu implementací na CPU (škálování se často provádí nadvakrát – nejdřív v jedné, pak v druhé dimenzi), opět asi kvůli výkonu. Škálování EASU je celkově vzato relativně jednoduché v porovnání s různými dalšími experimentálními postupy, které existují, což vysvětluje poměrně vysoký výkon výsledné implementace ve shaderech.

Výkon FSR, respektive výkon potřebný pro zvětšení jednoho snímku

FSR používá výpočty FP16, ale nevyžaduje je

Je také potvrzeno, že AMD pro zlepšení výkon shaderů, které upscaling počítají, používá výpočty s přesností FP16. Ta by pro tento účel měla stačit a značně snižuje zátěž GPU, kterou upscaling přidává, protože novější GPU umí FP16 počítat s dvojnásobným výkonem. FP16 ale podporují až GPU Vega (kde byla tato funkce uvedena pod označením Rapid Packed Math) a novější, u Nvidie je umí karty GeForce s architekturou Turing a novější GPU.

GPU používající implementaci v FP16 a GPU používající záložní verzi s výpočty FP32

Aby FSR fungovalo i na starších GPU, má také záložní kód, který používá operace FP32, jejichž hrubý výpočetní výkon je ale proti FP16 teoreticky jen poloviční. To znamená, že na grafikách architektury Polaris, na GeForce generace Pascal nebo na ještě starších a oficiálně nepodporovaných GPU bude nárůst výkonu získaný pomocí FSR o něco nižší. GPU Intel by FP16 měla také podporovat, takže by na nich snad mohla být také aktivní rychlejší 16bitová verze FSR (ale toto asi záleží na implementaci a ovladačích). Poznámka: AMD v tabulkách uvádí, že Pascaly FP16 používají, ale nejspíš jde o chybu, protože Pascaly mají FP16 pomalé. V tabulce je také pro FP32 uvedená generace Maxwell, která snad neměla být oficiálně podporovaná.

Nové hry s FSR

Od prvotního odhalení FidelityFX Super Resolution se už trošku rozrostl i seznam her, v kterých se FSR dá použít. Prakticky vzápětí přibyla Dota 2 a dále hra Necromunda: Hired Gun. Tento týden se přidal také Resident Evil Village (patch 1.03) a hra Marvel’s Avengers. Do konce měsíce by pak mělo FSR být zprovozněno ještě ve hře Edge of Eternity. Celkově by pak mělo být her zatím třináct, později mají přibýt ještě asi dva tucty Necromunda a Avengers obsahují jak podporu pro DLSS, tak pro FSR, takže pokud chcete, můžete porovnávat.

Nvidia DLSS má již zajištěnou přímo integraci do některých herních enginů, která implementaci usnadňuje. Toto by mělo nastat i s FSR, i když to, jak asi čekáte, není v tak pokročilém stádiu. FSR je dostupné v Unreal Engine 4 (4.26) jako patch. Vedle toho pak bude také přidáno do enginu Unity 21.2 HDRP, kde je zatím v speciální preview beta větvi.

Pro engine Unity bylo ukázáno i demo Spaceship (ovšem jen na videu), slibující až 1,9× zlepšení výkonu ve 4K v režimu Performance. Vedle toho má jednoduché samostatné demo také AMD, takže můžete FSR vyzkoušet, aniž byste museli kupovat nebo instalovat celou hru. Toto demo se dá najít třeba v archivu techPowerUpu.

FSR je prý velmi jednoduché přidat do hry

Náznaky, že budou další verze?

Je asi docela dost pravděpodobné, že se FSR bude dále zlepšovat (ostatně podobně, jak Nvidia neustále pracuje na zlepšeních svého DLSS). V tomto smyslu by mohla být zajímavá zmínka, která se objevila v dokumentaci. AMD na jednom místě doporučuje ve hrách „čudlík“ k zapnutí značovat jako „FSR 1.0“, jako by bylo důležité upozornit na to, že hra používá konkrétní verzi technologie, která by se měla rozlišovat od případných jiných následujících. Je proto pravděpodobné, že minimálně v tuto chvíli AMD plánuje i nějaké budoucí vylepšené verze, které by se mohly jmenovat třeba 1.1, 2.0 a tak podobně.

AMD FSR 1.0 a DLSS ve hře Necromunda (Zdroj: VideoCardz)

Jak moc lepší budou, to teď samozřejmě nelze odhadnout. Je možné, že taková „verze 2.0“ třeba vznikne až v momentě, pokud AMD někdy zavede do herních GPU specializovanou akceleraci AI operací. Nebo by mohlo jít opět o obecný výpočetní algoritmus pro shadery, ale využívající nějak jiné/přídavné techniky, ať už „2D“, nebo temporální. Je samozřejmě třeba upozornit, že přidání výpočetní komplexity do hypotetického „next-gen“ FSR také zvýší nároky na hardware, takže by filtr výměnou za lepší obraz mohl přinášet méně výkonu navíc.

Zdroje: AMD, GPUOpen, VideoCardz (1, 2), techPowerU

Jan Olšan, redaktor Cnews.cz

Back to: AMD FSR už je open-source, vyšly podpora v dalších hrách, demo a nové informace

Flattr this!

AMD FSR Radeon

the patient on DeepCool CH160 je lacná ITX skrinka pre veľké komponentyCena řešení od Sliger ale není zrovna pro lidi, co chtějí ušetřit 😅
Ľubomír Samák on Endorfy Fera 5 Black – Bestseller na cestě do temnoty„--- ... noctua nevedela vydat ine farby ani len vrtul, lebo to zrejme ovplyvnovalo ich...
Roob on Bonus do súťaže Enermax: K zdroju dostanete aj ventilátoryto uz je velky pruser, ked nikto nechce vec, co rozdavas ani zadarmo, twl. Imho...
Roob on Endorfy Fera 5 Black – Bestseller na cestě do temnotyto nieje take jednoznacne a napr. noctua nevedela vydat ine farby ani len vrtul, lebo...
the patient on Radeony RX 8000 nemají paměti GDDR7, ani rychlejší GDDR6Může se to na startu ukázat jako výhoda, z důvodu optimalizací. Ostatně PS také používá...
the patient on Radeony RX 8000 nemají paměti GDDR7, ani rychlejší GDDR6Přání otcem myšlenky. Spíš budou chtít zvýšit marži.
Ľubomír Samák on Endorfy Fera 5 Black – Bestseller na cestě do temnotyViac sa ale asi farba prejaví pri odvádzaní tepla sálaním ako prúdením? --- „v úvode...
the patient on Endorfy Fera 5 Black – Bestseller na cestě do temnotyTo nelze tak jednoduše říci, protože záleží, jakým způsobem bylo takové úpravy dosaženo.
Wingo on Radeony RX 8000 nemají paměti GDDR7, ani rychlejší GDDR6Nemám nič proti tomu ak AMD šetrí aby mohla nastaviť dobrú cenovku, RDNA4 vyzerá že...

AMD FSR: nové hry a informace, algoritmus Lanczos, využívá FP16

AMD FSR už je open-source, vyšly podpora v dalších hrách, demo a nové informace

První část filtru tvoří upravený Lanczos + anti-ringing

FSR používá výpočty FP16, ale nevyžaduje je

Nové hry s FSR

Náznaky, že budou další verze?

Radeony RX 8000 nemají paměti GDDR7, ani rychlejší GDDR6

AM5 základní desky už začaly dostávat podporu pro Zen 5

Radeony generace RDNA 4: Unikly specifikace a výkon obou GPU

Pridaj komentár Zrušiť odpoveď

Posledné komentáre

AMD FSR už je open-source, vyšly podpora v dalších hrách, demo a nové informace

První část filtru tvoří upravený Lanczos + anti-ringing

FSR používá výpočty FP16, ale nevyžaduje je

Nové hry s FSR

Náznaky, že budou další verze?

Súvisiace články

Pridaj komentár Zrušiť odpoveď

Posledné komentáre

Cookies