NVIDIA v DaVinci Resolve Studio
Z minulého článku už viete, aké úlohy sú vo video editore DaVinci Resolve Studio akcelerovateľné výkonnými grafickými kartami NVIDIA. Teraz máme pre vás rýchlostné porovnanie oproti jednoduchšími, integrovanými GPU. Konkrétne konfrontáciu RTX 4090 a RTX 4060 s riešením, ktoré majú najnovšie procesory Intel Raptor Lake Refresh. Rozdiel v prospech grafických kariet GeForce je priepastný.
Upozornenie: Tento článok vznikol na objednávku NVIDIA a je platený. Firma však žiadnym spôsobom nezasahovala do jeho obsahu a jediná podmienka bola otestovať v DaVinci Resolve (Studio) výkon GPU akcelerácie s použitím grafických kariet GeForce RTX.
A rovno k veci: K čomuže sa to viaže titulok článku? Funkcie Magic Mask a Super Scale v DaVinci Resolve Studio (18.6.2) s grafickými kartami GeForce RTX skvelo škálujú zatiaľ čo grafickým jadrom Intel UHD 770 na v procesoroch platformy LGA 1700 (Raptor Lake Refresh, Raptor Lake a Alder Lake) sú doslova nepoužiteľné. Pre zmenu farieb pixelov vybraných objektov videa (Magic Mask) či jeho doostrovanie a odšumovanie (Super Scale) sú grafické karty nevyhnutné.
Na slušný výsledok to nemusí byť hneď RTX 4090, ale možno vám bude stačiť v týchto úlohách aj RTX 4060. Tá je v nich síce tri až šesťkrát pomalšia, ale rýchlosť jej nechýba. Isteže, na profesionálne použitie s vysokou výťažnosťou bude vhodnejšia RTX 4090. Na porovnanie: To, s čím sú grafické karty s takýmto výkonným GPU hotové za 11 sekúnd, trvá Intel UHD 770 až 93-krát toľko (1025 sekúnd).
Ešte väčší rozdiel (90 vs. 9550 s) sme zaznamenali v testoch Super Scale. A to, samozrejme, po riadnych optimalizáciách testovacej aplikácie (DaVinci Resolve Studio) na neurónový engine. S AI úlohami si GPU bez tensorových jadier, s malým počtom shaderov i malou pamäťou, ktorú má k dispozícii, skrátka rozumne neporadí.
GPU NVIDIA je na neporovnateľne vyššej úrovni aj pokiaľ ide o nižšiu triedu grafickej karty, akou je RTX 4060. Tú možno zároveň považovať za „základné“ riešenie Optical Flow. Znamená to, že živé prehrávanie časovej je relatívne plynulé (aj keď nie bezchybne) aj s RTX 4060. Výsledok s RTX 4090 je ale lepší, plynulejší a prakticky už (bez prepadov) zodpovedá reálnemu času videa, pre ktoré sa touto interpoláciou dopočítavajú chýbajúce snímky.
Pre Smart Reframe je rýchlosť RTX 40×0 približne 13 až 14-násobkom Intel UHD 770. Z pohľadu Face Refinement už môže byť reč o relatívne menšom rozdiele vo výkone, ale pri dlhších videách sa i ten nazbiera a namiesto celého dňa i noci môže práca trvať iba niekoľko hodín.
V dobrom svetle sa ukazuje i kodér NVENC. Výkonnostné výsledky sú dosahované pri porovnateľnej kvalite výstupu, na čom sme si dali v rámci nastavení záležať. Dátový tok naprieč rôznymi kodérmi (NVENC/QuickSync) je porovnateľný a vizuálna kvalita takisto – posúďte sami.
Širokú ponuku rôznych grafických kariet s podporou NVIDIA Studio ale i hotových PC či notebookov má skladom aj partner tohto článku – eshop smarty.cz/smarty.sk.
- Contents
- NVIDIA v DaVinci Resolve Studio
- Na čom (a ako) testujeme
- Výsledky testov
- Vizuálne porovnanie video exportov
celkom prekvapive je, ze 4060 je skoro vsade skoro rovnako rychla ako 4090. Je to tym, ze 4090 mala nizke vytazenie a nestihal procesor?
Čo myslíte tým „skoro všade“? Niekde to môže v tom pomerovom porovnaní pôsobiť trochu skresľujúco… ako optická ilúzia, keď sú pruhy GeForce vždy výrazne kratšie ako iGPU Intel.
Limitácii procesorom by som nič z toho neprisudzoval. Skôr ide o mieru náročnosť úlohy (tá je pri Face Refinement relatívne nižšia a ukazuje sa to aj na menšom odskoku UHD 770). A potom porovnateľné výsledky pri kódovaní sú dané rovnakým kodérom. Tam nie je príliš dôvod, prečo by mala mať RTX 4090 navrch. Ak niekde (typicky pri spracovaní 8K videa s ohromným bitrate), tak to môže byť napríklad úzkym hrdlom RTX 4060 v podobe menšej pamäte alebo nejakou inou margináliou, ktorá v týchto situáciách nemá príliš vplyv na rýchlosť.
Test Optical Flow? Pre ten je RTX 4090 evidentne výrazne naddimenzovaná, takže na dosiahnutie optimálneho výsledku sa nevyužíva všetok výkon a vlastne skoro stačí i tne, čo má RTX 4060. Samozrejme, v iných situáciách, kde by sa dopočítavalo viac snímok v náročnejšom videu, by to mohlo vyzerať trochu inak. Je to len jeden z mnohých scenárov.
tak je tam 10 grafov. V 2 znich je 3x vykon, v ostatnych je to +/- autobus rovnake. Preco si myslim, ze to limituje procesor? Lebo doma ked preratavam v handbrake cez nvidia 2070, tak ani ona nieje 100% vytazena s ryzen7700.
a len tak btw. 4090 ma 5x viac vypoctovych jednotiek, takze je celkom prekvapive…
Zrovna tie sa ale na kódovaní videa nepodieľajú.
nie vsetky operacie sa daju absolutne perfektne paralelizovat == 5x vacsi pocet hocicoho neznamena nutne 5x vacsi realny vykon, 5x kratsiu dobu spracovania atd.
Navyse ako zaznelo, grafika karta je nesmierne zlozity technologicky celok s mnohymi charakteristikami a nie vsetky vypocty (spracovanie, ulohy, zataz, to je jedno ako „to“ nazveme) sa odohravaju na grafickych jadrach kde mozeme uplne jednoducho povedat „produkt XYZ ma 2.000 jadier, produkt ABC ma 10.000 jadier teda ABC musi byt 5x rychlejsia“. No holt nemusi.
Rovnaka vec sa odohrava vo Photoshope, Premiere, Autocad produktoch… 2x rychlejsia grafika karta neznamena 2x kratsi cas. Je totiz nesmierne komplikovane povedat co je to „2x rychlejsia graficka karta“. Ine prirovnanie : ked nasypem 2x silnejsi motor do auta, nepojde 2x vacsou rychlostou (100kW = 200km/h, 200kW sa nerovna 400km/h). Toto chapeme a pozname vsetci, takze uplne rovnaku vec je treba preniest na graficke karty, procesory, pamate (ddr5-8000 nedosiahne 2x mensi cas alebo 2x vacsie FPS v hrach ako ddr5-4000 keby existovala) atd, atd.
Realita. Prva veta mojho komentu znovu : „nie vsetky operacie sa daju absolutne perfektne paralelizovat“.
A určite sledujete záťaž správnej veci (t.j. v tomto prípade multimediálneho kodéra)?
sledujem ten graf v spravcovi uloh
Graf zaťaženia multimediálneho kodéra alebo GPU? To sú dve rozdielne veci.
ten hlavny graf, co je pod ethernetom, nad nim je disk, nad nim pamat a uplne hore procesor
To bude ukazovateľ, ktorý hovorí o vyťažení sharedov, RT jadier a tak… tam bude pri kódovaní vždy nízke zaťaženie, pretože sa tieto jednotky naň nevyužívajú. O záťaži grafickej karty z pohľadu kódovania sa treba zamerať na graf „video encode“. A vzhľadom na to, že RTX 4090 má rovnaký kodér ako RTX 4060 (NVENC 8), tak nemožno očakávať veľké rozdiely vo výkone. Ak sú tu nejaké rozdiely, tak budú spôsobené slabým miestom samotnej grafickej karty, napríklad malou pamäťou pri spracovaní väčších videí a tak.
Rozhodne sa v tejto problematike nepovažujem za nejakého extra odborníka, ale tie veci, čo opisujem, snáď dávajú zmysel. 🙂
Škoda, že nechystáte dílčí srovnání s konkurencí, protože při srovnání výsledné kvality by se mohl lámat chleba. Puget asi dopomůže lepšímu posouzení poměru cena/výkon, ale bez srovnání kvality to na druhou stranu může představu o schopnostech karet jednotlivých výrobců zkreslit. Ale nu což, díky Ľubo 🙂
PugetBench tu vnímam hlavne v kontexte toho „neurónového“ uchopenia, teda mimo úloh s kódovaním videa. Je pravda, že sa to niekde prekrýva (napríklad v Super Scale). Ale asi sa nedá vylúčiť, že aj tam kódovanie cieli naprieč rôznymi kodérmi cieli na porovnateľnú kvalitu. To, samozrejme, nevieme a pred reálnym nasadením by to bolo dobré zistiť, o čo sme sa zatiaľ nepokúšali a preto tieto veci máme iba v rámci testov procesorov a v testoch grafických kariet chýbajú.
Netvrdím, že sa podobný článok nikdy nestane a nie je to podmienený ani tým, že by ho muselo AMD finančne podporiť. Ale práve teraz (a v budúcnosti to možno iní nebude :)), keď máme veľký sklz vo veciach, ktoré sme si „sami vymysleli“ (čo sa týka spracovania), na to priestor nevidím. Frustrácia z toho, že ešte nemáme vydané testy ani jedného procesora Raptor Lake Resfresh je momentálne fakt veľká.