Proč chtít GeForce RTX 4000? Rozbor technologií Nvidia DLSS 3.5

Nvidia Reflex: Princip fungování

V tomto článku se podíváme na některé exkluzivní technologie, které vám můžou poskytnout grafické karty Nvidia GeForce generace RTX 4000. Některé jsme už probírali, jiné ne, zde tak naleznete vysvětlení nejzásadnějších novinek, které teď ekosystém grafik GeForce podporuje a testy ukazující, co dělají s výkonem ve hře Cyberpunk 2077 s novým rozšířením Phantom Liberty. A také se podíváme, co dělají s kvalitou obrazu.

Reflex: Jak mít co nejrychlejší reakce

Na tomto místě je proto dobré zmínit technologii Nvidia Reflex, poskytovanou exkluzivně grafikami Nvidia GeForce, která je důležitá pro soutěžní hraní. Reflex řeší právě problém, kterým je pro soutěžní hráče latence mezi ovládáním a zobrazením, nebo také lze říct mezi děním ve hře (včetně akcí protihráčů) a jejich zobrazením na monitoru. Tato latence představuje čas, který uběhne před tím, než se nějaká událost ve hře – třeba vynoření se nepřítele zpoza zdi – projeví na monitoru. A je to tedy čas, který se přidává jako negativní znevýhodnění k samotnému reakčnímu času hráče. Čím je tato latence nižší, tím má hráč větší výhodu, protože může začít reagovat dříve než protihráč. V soutěžním multiplayeru by co nejnižší latence přímo měla zlepšovat potenciál soutěžícího.

Předchozí řešení zaměřená na zkrácení latence (jako Low Latency Mode) pracují s eliminováním fronty snímků v ovladači, ale Reflex jde za možnosti těchto technologií. Reflex stojí na komponentě (Reflex SDK), kterou vývojáři integrují přímo do hry a tím se otevírají hlubší možnosti zkrácení různých odezev a zpoždění, která mezi vstupem a výstupem vznikají.

Vedle Reflex SDK a jeho integrace do her Reflex také nabízí měření vstupní latence periférií jako jsou myši, klávesnice, ale i latence monitorů. Tato funkce Reflex Latency Analyzer spolupracuje s podporovaným hardwarem a monitory s G-Sync. Pro většinu hráčů bude asi relevantní hlavně Reflex SDK a jeho integrace ve hrách, což na speciální myši či monitory navázáno není.

Při hraní vždy nějakou latenci máte a jejím zdrojem je současně mnoho věcí. Moc nemůžete udělat s latencí síťového připojení (pokud máte to nejlepší možné či vám dostupné), která představuje zpoždění (lag či „ping“) paketů mezi vámi a serverem hry. Nvidia Reflex se snaží zmírnit další latenci, která nastává až u vás na počítači, kterou nazývá latence systému („System Latency“). Do ní „přispívá“ vstupní prodleva vaší myši, klávesnice a zpracován jejich signálů v operačním systému na začátku a na konci zase zpoždění mezi tím, kdy je hotový snímek z grafiky poslán do monitoru a kdy je skutečně zobrazen (monitor má určitou odezvu panelu a také input lag elektroniky).

Zdroje latencí v PC hraní

Mezi těmito latencemi periférií a monitoru pak leží latence, která je dána samotnou hrou a jejím kódem, jenž musí zpracovat vstupy hráče či hráčů, vypočítat, co udělají s herní scénou, jak se v ní všechny objekty zachovají. Tato část probíhá zejména na procesoru herního počítače a Nvidia jí říká latence hry („Game Latency“). Poté hra rozkáže grafickému ovladači vykreslit snímek hry, který výsledek tohoto ukazuje. Výroba tohoto snímku na GPU je pak latence vykreslování („Render Latency“).

Když vám hra běží při vysoké snímkové frekvenci díky dostatečnému výkonu GPU, zkracuje se nepřímou úměrností trvání snímků a čas, za který jsou zpracovány, takže vysoký výkon sám zkracuje latenci hry a latenci vykreslování. Jen vysoké FPS ale nejsou všechno, co potřebujete, protože to, jak hra pracuje, může latenci uměle zvyšovat. Přidání Reflexu do her ve spolupráci s ovladači grafik GeForce se toto snaží co možná eliminovat. Hlavním způsobem je, že se omezí různé prostoje, které se ve hře mohou vytvářet pomocí lepší synchronizace s nízkou latencí, která má zajistit, aby snímky odcházely k vykreslení do monitoru co nejdříve.

Pipeline hry s použitím Nvidia Reflex

Prvním krokem je omezení toho, aby část hry běžící na CPU generovala přebytek snímků pro další části vykreslování běžící na GPU (tzv. CPU Back Pressure). Když se toto děje, vznikne fronta čekajících snímků, které ale každý zhoršují latenci. Další takováto fronta může pak vznikat i v části běžící na GPU v tzv. „Render Queue“. Reflex usiluje o to, aby celý komplex hry běžící na CPU a GPU fungoval stylem „just in time“, tedy aby hotové podklady snímku ze zpracování na CPU dorazily na GPU zhruba ve chvíli, kdy na nich GPU může začít pracovat (bez odkladu) a pak zase co možná bez odkladu mohly rovnou být odeslány na monitor.

Low Latency Boost pro GPU

Hra se integrovaným Reflexem by tedy měla regulovat tempo, s nímž jsou v části běžící na CPU vyráběny podklady pro nové snímky, když je GPU nezvládá tak rychle zpracovávat. Tím by vznikl onen popisovaný negativní jev CPU Back Pressure a zvýšila se latence hry. Reflex proto dynamicky řídí to, kdy jsou snímky GPU zadávány.

Zároveň ovladače GPU mohou zvýšit frekvenci GPU tak, aby jím byly snímky vykreslovány rychleji, Reflex tedy komunikuje i s řízením frekvencí GPU. Tato funkce se nazývá Low Latency Boost a má schopnost přebíjet normální řízení spotřeby GPU, které se snaží optimalizovat jeho takty na vyšší celkovou energetickou efektivitu. Low Latency Boost by měl mít možnost v situaci, kdy hrozí zpoždění vykreslování, vytočit takty i za cenu ztráty efektivity dočasně výš.

Tento Low Latency Boost může paradoxně pomoci u her, kde je zátěž GPU poměrně malá, protože jsou nenáročné a limituje je hlavně procesor. V takových situacích totiž grafika má tendenci běžet v úsporných režimech a s nižšími takty. Ty ale mohou u soutěžní hry vést k oněm vyšším latencím vykreslování. Low Latency Boost tedy i v takovém stavu, kde je GPU málo vytížené, aktivuje nejvýkonnější režim, aby se latence vykreslování co nejvíc zkrátily. Toto vede ovšem ke zvýšení spotřeby GPU, kdy nenáročná hra, u níž čekáte nízkou spotřebu, konzumuje poměrně dost wattů (a generuje vyšší teploty GPU). Například pro případy hraní na notebooku je proto možné Low Latency Boost vypnout a ponechat Reflex zapnutý bez něj.

Podrobnější rozložení jednotlivých fází, které snímek hry absolvuje na CPU a GPU

V krátkosti řečeno se podle Nvidia Reflex snaží v situacích, kdy je hra limitovaná výkonem GPU (tedy třeba v náročné scéně, kdy klesnou FPS) zamezit tomu, aby CPU běželo napřed a vytvořilo několik čekajících snímků (zhoršujících latenci vykreslování). A naopak v situacích, kdy je limit na straně CPU, se Reflex snaží minimalizovat čas, který snímkům trvá, než je GPU vykreslí (latence vykreslování) a pošle dál tím, že drží takty GPU vysoké.

Pro GeForce GTX 900 a novější

Funkce Reflex funguje jen na grafikách Nvidia GeForce, ale podporuje i starší generace (až po GeForce GTX 900). Low Latency Boost by měla ale nejlépe fungovat na GeForce RTX 3000 a novějších grafikách, které jsou schopné lépe při jeho aktivaci navýšit takty.

Zlepšení odezvy díky Reflexu by měla být samozřejmě nejdůležitější pro hry s PvP multiplayerem a obecně soutěžním multiplayerem a eSports hry – tedy včetně populárních titulů jako Fortnite, Valorant, Apex Legends, Call of Duty.

Latence systému ve hrách s Reflexem a bez dle Nvidie

Reflex a Generování snímků

Zatímco v jádru je Reflex nejzajímavější pro takovéto soutěžní hráče, technologie se stala důležitou i ve hrách, kde by se na latenci jinak příliš nehledělo s příchodem DLSS 3 (a později DLSS 3.5), jež přineslo generování snímků.

Jak už bylo řečeno, při hraní vždy nějakou latenci máte, vytváří jí vstupní zařízení i zpracování těchto podnětů ve hře, fyzikální výpočty a vykreslování, input lag elektroniky monitoru a ještě i odezva pixelů panelu. Toto vše se sčítá v poměrně velkou sumu milisekund. Generování snímků, jak bylo řečeno, musí odkládat vykreslování posledního snímku (protože ten bude následovat až po zobrazení toho uměle dogenerovaného) a tudíž přidává samo nějakou další latenci navíc. Nemusí to už být až zas tolik milisekund proti všem ostatním faktorům dohromady, aby to enormně vadilo, Avšak nějaké zhoršení zde z podstaty věci vždy nastává. V poslední době je snaha aspoň pro rychlé soutěžní hry tyto latence zkracovat a eliminovat, zatímco generování snímků jde opačným směrem.

Proto má DLSS 3/3.5 při použití generování snímků současně integrovanou technologii Reflex, jejíž účelem je zase latenci snížit. Reflex nemůže odstranit ono inherentní prodloužení latence, které generováním snímku vzniklo, tedy onen negativní efekt nutnosti bufferovat aspoň jeden budoucí snímek pro interpolaci předchozího. Reflex ale dělá to, že potlačuje ostatní zdroje latence (a to latence hry a latence vykreslování před tím, než přijde řada na generování snímků).

Jde tedy o kompenzaci tohoto negativního vlivu. V případě, že začnete s hrou již optimalizovanou na nízkou latenci tím, že jste si zapnuli Reflex, a pak k tomu aktivujete generování snímků navíc, latence vám samozřejmě stoupne, protože Reflex už předtím potenciály k snížení latence využil a dále nemá kde brát.


  •  
  •  
  •  
Flattr this!

DirectSR, sjednocený upscaling ve hrách je tu. Vzal si něco z FSR

Před nedávnem se objevily informace o technologii DirectSR, kterou chystá Microsoft jako novou součást API DirectX, nad nímž je postavená většina her pro PC. DirectX standardizuje mnoho věcí včetně API pro 3D grafiku, s DirectSR se k tomu přidá rozhraní, přes které hry budou moci snadno používat upscaling, jako je DLSS. A to bez toho, aby musely přímo podporovat všechna různá řešení výrobců GPU, každé zvlášť. Celý článok „DirectSR, sjednocený upscaling ve hrách je tu. Vzal si něco z FSR“ »

  •  
  •  
  •  

FSR 3.1 zlepšuje kvalitu, umí přidat generování snímků k DLSS

Na grafické konferenci GDC 2024 odhalilo AMD novou verzi herního upscalingu FidelityFX Super Resolution (FSR) 3.1. Jde o evoluční vylepšení vycházející z loňského FSR 3.0, které má mimo jiného zlepšovat obrazovou kvalitu, ale současně přináší zajímavou změnu. Ve FSR 3 se objevila technologie generování snímků (analogická generování snímků v DLSS 3 a 3.5 od Nvidie). Ta se v generaci FSR 3.1 dá nově využít i samostatně a zkombinovat s DLSS. Celý článok „FSR 3.1 zlepšuje kvalitu, umí přidat generování snímků k DLSS“ »

  •  
  •  
  •  

DirectSR: Sjednocení DLSS, XeSS a FSR, konec nekompatibility

Už by to mělo být pět let, co Nvidia začala prosazovat do her upscaling s první generací DLSS spojenou s grafikami GeForce RTX 2000. Tento přístup se uchytil a nyní mají jak AMD, tak Intel vlastní alternativy FSR a XeSS. Velká nevýhoda je, že každá z těchto technologií se do her musí přidávat zvlášť. Záchranou teď může být Microsoft, který z upscalingu dělá standardní součást DirectX, takže už nebudete omezení tím, čí GPU vlastníte. Celý článok „DirectSR: Sjednocení DLSS, XeSS a FSR, konec nekompatibility“ »

  •  
  •  
  •  

One comment Pridať komentár

  1. Proč chtít RTX 4000, když mě DLSS absolutně nezajímá. Nechci nějakej náhodně generovanej obraz, sorry jako.

    Ale něco tam přeci je, RTX 3070 má 8GB VRAM, což je dnes tak tak na fullHD. Na 1440p je i 10GB od RTX 3080 docela na hraně, takže i RTX 4070 se 12GB bude mít jistou výhodu. No a až po novým roce NVidia udělá reedici RTX 4080 pro normální hráče, která už má být za adekvátní cenu, tak bude na ty hry až do 4K ideální taky.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *