Site icon HWCooling.net

Výkon AI v „DaVinci“: NVIDIA je aj 100× rýchlejšia ako iGPU

Vizuálne porovnanie video exportov

Z minulého článku už viete, aké úlohy sú vo video editore DaVinci Resolve Studio akcelerovateľné výkonnými grafickými kartami NVIDIA. Teraz máme pre vás rýchlostné porovnanie oproti jednoduchšími, integrovanými GPU. Konkrétne konfrontáciu RTX 4090 a RTX 4060 s riešením, ktoré majú najnovšie procesory Intel Raptor Lake Refresh. Rozdiel v prospech grafických kariet GeForce je priepastný.

Upozornenie: Tento článok vznikol na objednávku NVIDIA a je platený. Firma však žiadnym spôsobom nezasahovala do jeho obsahu a jediná podmienka bola otestovať v DaVinci Resolve (Studio) výkon GPU akcelerácie s použitím grafických kariet GeForce RTX.


A rovno k veci: K čomuže sa to viaže titulok článku? Funkcie Magic MaskSuper ScaleDaVinci Resolve Studio (18.6.2) s grafickými kartami GeForce RTX skvelo škálujú zatiaľ čo grafickým jadrom Intel UHD 770 na v procesoroch platformy LGA 1700 (Raptor Lake Refresh, Raptor Lake a Alder Lake) sú doslova nepoužiteľné. Pre zmenu farieb pixelov vybraných objektov videa (Magic Mask) či jeho doostrovanie a odšumovanie (Super Scale) sú grafické karty nevyhnutné.

Na slušný výsledok to nemusí byť hneď  RTX 4090, ale možno vám bude stačiť v týchto úlohách aj RTX 4060. Tá je v nich síce tri až šesťkrát pomalšia, ale rýchlosť jej nechýba. Isteže, na profesionálne použitie s vysokou výťažnosťou bude vhodnejšia RTX 4090. Na porovnanie: To, s čím sú grafické karty s takýmto výkonným GPU hotové za 11 sekúnd, trvá Intel UHD 770 až 93-krát toľko (1025 sekúnd).

Ešte väčší rozdiel (90 vs. 9550 s) sme zaznamenali v testoch Super Scale. A to, samozrejme, po riadnych optimalizáciách testovacej aplikácie (DaVinci Resolve Studio) na neurónový engine. S AI úlohami si GPU bez tensorových jadier, s malým počtom shaderov i malou pamäťou, ktorú má k dispozícii, skrátka rozumne neporadí.

GPU NVIDIA je na neporovnateľne vyššej úrovni aj pokiaľ ide o nižšiu triedu grafickej karty, akou je RTX 4060. Tú možno zároveň považovať za „základné“ riešenie Optical Flow. Znamená to, že živé prehrávanie časovej je relatívne plynulé (aj keď nie bezchybne) aj s RTX 4060. Výsledok s RTX 4090 je ale lepší, plynulejší a prakticky už (bez prepadov) zodpovedá reálnemu času videa, pre ktoré sa touto interpoláciou dopočítavajú chýbajúce snímky.

Pre Smart Reframe je rýchlosť RTX 40×0 približne 13 až 14-násobkom Intel UHD 770. Z pohľadu Face Refinement už môže byť reč o relatívne menšom rozdiele vo výkone, ale pri dlhších videách sa i ten nazbiera a namiesto celého dňa i noci môže práca trvať iba niekoľko hodín.

V dobrom svetle sa ukazuje i kodér NVENC. Výkonnostné výsledky sú dosahované pri porovnateľnej kvalite výstupu, na čom sme si dali v rámci nastavení záležať. Dátový tok naprieč rôznymi kodérmi (NVENC/QuickSync) je porovnateľný a vizuálna kvalita takisto – posúďte sami.

Širokú ponuku rôznych grafických kariet s podporou NVIDIA Studio ale i hotových PC či notebookov má skladom aj partner tohto článku – eshop smarty.cz/smarty.sk.


Z minulého článku už viete, aké úlohy sú vo video editore DaVinci Resolve Studio akcelerovateľné výkonnými grafickými kartami NVIDIA. Teraz máme pre vás rýchlostné porovnanie oproti jednoduchšími, integrovanými GPU. Konkrétne konfrontáciu RTX 4090 a RTX 4060 s riešením, ktoré majú najnovšie procesory Intel Raptor Lake Refresh. Rozdiel v prospech grafických kariet GeForce je priepastný.

Na čom (a ako) testujeme

Na testy používame dve rôzne výkonne grafické karty GeForce (Gigabyte RTX 4090 Gaming OC 24G a Gigabyte RTX 4060 Windforce OC 8G) s vypnutým ReSizable BAR. To vždy na platforme Intel Z790 (s použitím základnej dosky Gigabyte Z790 Aorus Elite X WiFi7 rev. 1.0, BIOS F5b) a procesora Intel Core i7-14700K s PL2 na 253 W. Pamäte (DDR5) sú Patriot Patriot Elite 5 (2× 16 GB), 6200 MHz/CL42 a SSD Patriot Viper VP4300 Lite (2 TB).

Grafické jadro procesora Intel Raptor Lake Refresh (UHD 770) používame aj na porovnanie s grafickými kartami GeForce RTX. Možno to teda považovať za akúsi demonštráciu pracovných staníc s použitím výkonných GPU (NVIDIA) s takými, ktoré spoliehajú iba na iGPU. V prípade grafických kariet GeForce sú použité aj „štúdiové“ ovládače 537.58 (WHQL). Tie môžu, ale i nemusia byť v aplikačnom prostredí zvyšovať výkon. Záleží na tom, či sú alebo nie sú pre danú úlohu optimalizované. Každopádne oproti „herným“ (Game Ready) by ste si nemali pohoršiť. iGPU Intel UHD 770 používa ovládače v31.0.101.4887.

Výkonnostné merania prebiehajú v troch konfiguráciách a režimoch. Jednak teda s grafickými kartami GeForce, kde sú samostatne použité modely RTX 4090 a RTX 4060 (s optimalizáciami Nvidia na s ohľadom na neurónový engine) a potom s integrovaným adaptérom Intel UHD 770 s  32 EU. Akcelerácia GPU je použitá vždy, vypnúť sa v DaVinci Resolve Studio 18.6.2 nedá.

Nižšie je zoznam testovacích úloh, ku ktorým podrobnosti (vrátane vzoriek videí a nastavení) nájdete kliknutím na ich názov. Táto akcia vás presmeruje na predošlý článok, v ktorom sme sa tejto problematike venovali viac.

Do grafov zapisujeme aritmetický priemer troch priechodov každého testu s výnimkou na iGPU nadmerne pomalých Magic Mask a Super Scale (u nich vychádzame z priemeru dvoch meraní). A na čo najvyššiu presnosť testovanie prebieha v stálom, prísne kontrolovanom prostredí (teplotne i čo sa týka prietoku vzduchu), aké poznáte zo štandardných testov grafických kariet.


Z minulého článku už viete, aké úlohy sú vo video editore DaVinci Resolve Studio akcelerovateľné výkonnými grafickými kartami NVIDIA. Teraz máme pre vás rýchlostné porovnanie oproti jednoduchšími, integrovanými GPU. Konkrétne konfrontáciu RTX 4090 a RTX 4060 s riešením, ktoré majú najnovšie procesory Intel Raptor Lake Refresh. Rozdiel v prospech grafických kariet GeForce je priepastný.

Výsledky testov












Z minulého článku už viete, aké úlohy sú vo video editore DaVinci Resolve Studio akcelerovateľné výkonnými grafickými kartami NVIDIA. Teraz máme pre vás rýchlostné porovnanie oproti jednoduchšími, integrovanými GPU. Konkrétne konfrontáciu RTX 4090 a RTX 4060 s riešením, ktoré majú najnovšie procesory Intel Raptor Lake Refresh. Rozdiel v prospech grafických kariet GeForce je priepastný.

Testovací vzorek Tears of Steel

Pro ilustraci jsme ještě testovali enkódování vzorku Tears of Steel s vysokým bitratem a nastavením stejné bitrate (8K 67 Mb/s) pro všechny enkodéry, což znamená, že videa mají velmi málo kompresních artefaktů. Na výsledných snímcích je těžké najít rozdíly, jak AV1, tak HEVC enkodéry NVENC podávají dobrý výsledek.

Scéna 1, AV1 versus HEVC (NVENC) v ICATu
Scéna 3, AV1 versus HEVC (NVENC) v ICATu
Scéna 4, AV1 versus HEVC (NVENC) v ICATu

Snímky v rozlišení 4K (bezeztrátový PNG) můžete stáhnout zde, pokud chcete po rozdílech mezi jednotlivými pixely zapátrat.

Tears of Steel Sc. 1 (AV1@NVENC)
Tears of Steel Sc. 1 (HEVC@NVENC)
Tears of Steel Sc. 1 (HEVC@QuickSync)
Tears of Steel Sc. 2 (AV1@NVENC)
Tears of Steel Sc. 2 (HEVC@NVENC)
Tears of Steel Sc. 2 (HEVC@QuickSync)
Tears of Steel Sc. 3 (AV1@NVENC)
Tears of Steel Sc. 3 (HEVC@NVENC)
Tears of Steel Sc. 3 (HEVC@QuickSync)
Tears of Steel Sc. 4 (AV1@NVENC)
Tears of Steel Sc. 4 (HEVC@NVENC)
Tears of Steel Sc. 4 (HEVC@QuickSync)