Výkon AI v „DaVinci“: NVIDIA je aj 100× rýchlejšia ako iGPU

NVIDIA v DaVinci Resolve Studio

Z minulého článku už viete, aké úlohy sú vo video editore DaVinci Resolve Studio akcelerovateľné výkonnými grafickými kartami NVIDIA. Teraz máme pre vás rýchlostné porovnanie oproti jednoduchšími, integrovanými GPU. Konkrétne konfrontáciu RTX 4090 a RTX 4060 s riešením, ktoré majú najnovšie procesory Intel Raptor Lake Refresh. Rozdiel v prospech grafických kariet GeForce je priepastný.

Upozornenie: Tento článok vznikol na objednávku NVIDIA a je platený. Firma však žiadnym spôsobom nezasahovala do jeho obsahu a jediná podmienka bola otestovať v DaVinci Resolve (Studio) výkon GPU akcelerácie s použitím grafických kariet GeForce RTX.


A rovno k veci: K čomuže sa to viaže titulok článku? Funkcie Magic MaskSuper ScaleDaVinci Resolve Studio (18.6.2) s grafickými kartami GeForce RTX skvelo škálujú zatiaľ čo grafickým jadrom Intel UHD 770 na v procesoroch platformy LGA 1700 (Raptor Lake Refresh, Raptor Lake a Alder Lake) sú doslova nepoužiteľné. Pre zmenu farieb pixelov vybraných objektov videa (Magic Mask) či jeho doostrovanie a odšumovanie (Super Scale) sú grafické karty nevyhnutné.

Na slušný výsledok to nemusí byť hneď  RTX 4090, ale možno vám bude stačiť v týchto úlohách aj RTX 4060. Tá je v nich síce tri až šesťkrát pomalšia, ale rýchlosť jej nechýba. Isteže, na profesionálne použitie s vysokou výťažnosťou bude vhodnejšia RTX 4090. Na porovnanie: To, s čím sú grafické karty s takýmto výkonným GPU hotové za 11 sekúnd, trvá Intel UHD 770 až 93-krát toľko (1025 sekúnd).

Ešte väčší rozdiel (90 vs. 9550 s) sme zaznamenali v testoch Super Scale. A to, samozrejme, po riadnych optimalizáciách testovacej aplikácie (DaVinci Resolve Studio) na neurónový engine. S AI úlohami si GPU bez tensorových jadier, s malým počtom shaderov i malou pamäťou, ktorú má k dispozícii, skrátka rozumne neporadí.

GPU NVIDIA je na neporovnateľne vyššej úrovni aj pokiaľ ide o nižšiu triedu grafickej karty, akou je RTX 4060. Tú možno zároveň považovať za „základné“ riešenie Optical Flow. Znamená to, že živé prehrávanie časovej je relatívne plynulé (aj keď nie bezchybne) aj s RTX 4060. Výsledok s RTX 4090 je ale lepší, plynulejší a prakticky už (bez prepadov) zodpovedá reálnemu času videa, pre ktoré sa touto interpoláciou dopočítavajú chýbajúce snímky.

Pre Smart Reframe je rýchlosť RTX 40×0 približne 13 až 14-násobkom Intel UHD 770. Z pohľadu Face Refinement už môže byť reč o relatívne menšom rozdiele vo výkone, ale pri dlhších videách sa i ten nazbiera a namiesto celého dňa i noci môže práca trvať iba niekoľko hodín.

V dobrom svetle sa ukazuje i kodér NVENC. Výkonnostné výsledky sú dosahované pri porovnateľnej kvalite výstupu, na čom sme si dali v rámci nastavení záležať. Dátový tok naprieč rôznymi kodérmi (NVENC/QuickSync) je porovnateľný a vizuálna kvalita takisto – posúďte sami.

Širokú ponuku rôznych grafických kariet s podporou NVIDIA Studio ale i hotových PC či notebookov má skladom aj partner tohto článku – eshop smarty.cz/smarty.sk.


  •  
  •  
  •  
Flattr this!

Nvidia DLSS (3.5) v Alan Wake II. Kdy hra běží nejlépe?

Alan Wake II je prvá hra, v ktorej sú od začiatku podporované Nvidia DLSS 3.5. Okrem technologickej stránky je tu aj vysoká popularita hráčov. Tým máme pokope základné dôvody na to, prečo sa podrobne pozrieť na fungovanie pri rôznych nastaveniach. V prieniku s herným výkonom sa budeme zaujímať nielen o vizuálnu stránku, ale aj spotrebu. Nielen grafickej karty, ale i procesora. Celý článok „Nvidia DLSS (3.5) v Alan Wake II. Kdy hra běží nejlépe?“ »

  •  
  •  
  •  

Minitest: Lacné zdroje vs. pískanie cievok grafických kariet

Veľkú analýzu vplyvu pískania cievok grafických kariet v závislosti od použitého zdroja už máte za sebou. Na to, aby za ňou šlo dať bodku, chýba ešte jedna vec. A tou je doplnenie správania sa lacných zdrojov s nižšou kvalitou súčiastok. V opačnom prípade by sa dalo stále špekulovať o tom, že naprieč triedami sa môže situácia výrazne odlišovať. Môže? Na to sa zameriame v meraniach so zdrojmi „80 Plus“, z ktorých jeden je už aj pomerne starý. Celý článok „Minitest: Lacné zdroje vs. pískanie cievok grafických kariet“ »

  •  
  •  
  •  

Aká kombinácia píska najmenej? 12 zdrojov, 3 grafické karty…

„Po výmene zdroja prestali pískať cievky grafickej karty“. Mimoriadne časté tvrdenie a pritom zostáva vždy iba na subjektívnej úrovni, čo je škoda. Ale aj preto sa teraz na veci pozrieme exaktným spôsobom, číselne. To otestovaním viacerých grafických kariet, kde sa pri každej sleduje hlučnosti cievok VRM v závislosti od použitého zdroja ATX (3.0). Ako je to s tým „pískaním“? Kedy je silnejšie a kedy slabšie? Celý článok „Aká kombinácia píska najmenej? 12 zdrojov, 3 grafické karty…“ »

  •  
  •  
  •  

Komentáre (13) Pridať komentár

  1. celkom prekvapive je, ze 4060 je skoro vsade skoro rovnako rychla ako 4090. Je to tym, ze 4090 mala nizke vytazenie a nestihal procesor?

    1. Čo myslíte tým „skoro všade“? Niekde to môže v tom pomerovom porovnaní pôsobiť trochu skresľujúco… ako optická ilúzia, keď sú pruhy GeForce vždy výrazne kratšie ako iGPU Intel.

      Limitácii procesorom by som nič z toho neprisudzoval. Skôr ide o mieru náročnosť úlohy (tá je pri Face Refinement relatívne nižšia a ukazuje sa to aj na menšom odskoku UHD 770). A potom porovnateľné výsledky pri kódovaní sú dané rovnakým kodérom. Tam nie je príliš dôvod, prečo by mala mať RTX 4090 navrch. Ak niekde (typicky pri spracovaní 8K videa s ohromným bitrate), tak to môže byť napríklad úzkym hrdlom RTX 4060 v podobe menšej pamäte alebo nejakou inou margináliou, ktorá v týchto situáciách nemá príliš vplyv na rýchlosť.

      Test Optical Flow? Pre ten je RTX 4090 evidentne výrazne naddimenzovaná, takže na dosiahnutie optimálneho výsledku sa nevyužíva všetok výkon a vlastne skoro stačí i tne, čo má RTX 4060. Samozrejme, v iných situáciách, kde by sa dopočítavalo viac snímok v náročnejšom videu, by to mohlo vyzerať trochu inak. Je to len jeden z mnohých scenárov.

      1. tak je tam 10 grafov. V 2 znich je 3x vykon, v ostatnych je to +/- autobus rovnake. Preco si myslim, ze to limituje procesor? Lebo doma ked preratavam v handbrake cez nvidia 2070, tak ani ona nieje 100% vytazena s ryzen7700.

          1. nie vsetky operacie sa daju absolutne perfektne paralelizovat == 5x vacsi pocet hocicoho neznamena nutne 5x vacsi realny vykon, 5x kratsiu dobu spracovania atd.

            Navyse ako zaznelo, grafika karta je nesmierne zlozity technologicky celok s mnohymi charakteristikami a nie vsetky vypocty (spracovanie, ulohy, zataz, to je jedno ako „to“ nazveme) sa odohravaju na grafickych jadrach kde mozeme uplne jednoducho povedat „produkt XYZ ma 2.000 jadier, produkt ABC ma 10.000 jadier teda ABC musi byt 5x rychlejsia“. No holt nemusi.

            Rovnaka vec sa odohrava vo Photoshope, Premiere, Autocad produktoch… 2x rychlejsia grafika karta neznamena 2x kratsi cas. Je totiz nesmierne komplikovane povedat co je to „2x rychlejsia graficka karta“. Ine prirovnanie : ked nasypem 2x silnejsi motor do auta, nepojde 2x vacsou rychlostou (100kW = 200km/h, 200kW sa nerovna 400km/h). Toto chapeme a pozname vsetci, takze uplne rovnaku vec je treba preniest na graficke karty, procesory, pamate (ddr5-8000 nedosiahne 2x mensi cas alebo 2x vacsie FPS v hrach ako ddr5-4000 keby existovala) atd, atd.

            Realita. Prva veta mojho komentu znovu : „nie vsetky operacie sa daju absolutne perfektne paralelizovat“.

                1. To bude ukazovateľ, ktorý hovorí o vyťažení sharedov, RT jadier a tak… tam bude pri kódovaní vždy nízke zaťaženie, pretože sa tieto jednotky naň nevyužívajú. O záťaži grafickej karty z pohľadu kódovania sa treba zamerať na graf „video encode“. A vzhľadom na to, že RTX 4090 má rovnaký kodér ako RTX 4060 (NVENC 8), tak nemožno očakávať veľké rozdiely vo výkone. Ak sú tu nejaké rozdiely, tak budú spôsobené slabým miestom samotnej grafickej karty, napríklad malou pamäťou pri spracovaní väčších videí a tak.

                  Rozhodne sa v tejto problematike nepovažujem za nejakého extra odborníka, ale tie veci, čo opisujem, snáď dávajú zmysel. 🙂

  2. Škoda, že nechystáte dílčí srovnání s konkurencí, protože při srovnání výsledné kvality by se mohl lámat chleba. Puget asi dopomůže lepšímu posouzení poměru cena/výkon, ale bez srovnání kvality to na druhou stranu může představu o schopnostech karet jednotlivých výrobců zkreslit. Ale nu což, díky Ľubo 🙂

    1. PugetBench tu vnímam hlavne v kontexte toho „neurónového“ uchopenia, teda mimo úloh s kódovaním videa. Je pravda, že sa to niekde prekrýva (napríklad v Super Scale). Ale asi sa nedá vylúčiť, že aj tam kódovanie cieli naprieč rôznymi kodérmi cieli na porovnateľnú kvalitu. To, samozrejme, nevieme a pred reálnym nasadením by to bolo dobré zistiť, o čo sme sa zatiaľ nepokúšali a preto tieto veci máme iba v rámci testov procesorov a v testoch grafických kariet chýbajú.

      Netvrdím, že sa podobný článok nikdy nestane a nie je to podmienený ani tým, že by ho muselo AMD finančne podporiť. Ale práve teraz (a v budúcnosti to možno iní nebude :)), keď máme veľký sklz vo veciach, ktoré sme si „sami vymysleli“ (čo sa týka spracovania), na to priestor nevidím. Frustrácia z toho, že ešte nemáme vydané testy ani jedného procesora Raptor Lake Resfresh je momentálne fakt veľká.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *