Nvidia RTX Studio alebo keď CPU a grafické shadery nestačia

Čo je RTX Studio a ako môžu jadrá Tensor zvýšiť výpočtový výkon?

Názvoslovie RTX Studio Nvidia používa pri pracovných stolových počítačoch alebo pri notebookoch, ktoré majú výkonnú grafickú kartu GeForce RTX alebo Quadro RTX. Tá v určitých aplikáciách môže výrazne zvyšovať výpočtový výkon (a s ním aj produktivitu) zapojením tensorových jadier. Ako a kde takáto forma hardvérovej akcelerácie funguje si ukážeme v prehľadovom článku.

Upozornenie: Tento článok vznikol na objednávku Nvidie a je platený. Firma však nijakým spôsobom nezasahovala do jeho obsahu a jediná podmienka bola priblížiť čitateľom výhody platformy RTX Studio. Namerané výsledky v testoch sú naše vlastné.

Začneme úplne od podlahy, teda od toho, čo vôbec hardvérové urýchľovanie (alebo akcelerácia) je. Cieľom tohto článku je, aby sa v ňom zorientovali aj bežní používatelia, ktorí sa o hardvér zase až tak podrobne nezaujímajú, ale vysoký výpočtový výkon je pre ich prácu dôležitý.

Pod pojmom hardvérová akcelerácia sa rozumie zvýšenie aplikačného výkonu pomocou sily grafickej karty. Väčšina výpočtových úloh je ale i tak závislá na výkone procesora. Niektoré úplne (tzn., že hardvérovú akceleráciu nepodporujú), niektoré do významnej miery (a grafická karta počíta iba čiastkové úlohy), ale sú i také, čo CPU na svoj chod zase až tak nepotrebujú a výpočty bežia z drvivej väčšiny na grafickej karte.

Existujú tri formy hardvérovej akcelerácie. Jeden spôsob využíva grafický kodér (samostatný obvod, NVEnc, aktuálne v 7. generácii), druhý shadery (API DirectML, DirectX alebo CUDA) a tretí k nim ešte pridáva nové jednotky, ktoré pribudli do grafických kariet GeForce RTX a Quadro RTX – tensorové jadrá. A tých aplikácií, ktorú túto formu urýchľovania podporujú, je už pomerne dosť. Často sa táto RTX akcelerácia alebo TC akcelerácia, keď ju odvodíme od tensorových jadier, využíva iba na vybrané filtre, ale niektorí programátori si dali záležať a tieto jednotky (tensorové jadrá) využívajú pomerne efektívne.

Dobrá ukážka toho sú aj AI aplikácie Topaz Labs, ktoré urýchľovanie tensorovými jadrami podporujú. Poznať ich už môžete z našich testov procesorov, ktorých výkon si pri tejto príležitosti porovnáme s GPU GA102 v grafickej karte Aorus GeForce RTX 3080 Xtreme 10G s BIOSom OC.

Poznámka: Výkon grafických kariet je zaznamenávaný na platforme AMD s procesorom Ryzen 9 5900X. S Aorus RTX 3080 Xtreme 10G sú to vždy štúdiové. V aplikáciách Topaz Labs 471.11 a Adobe Lightroom Classic, v Blenderi sú to 462.31. S grafikou kartou GeForce GT 1030 sú použité už herné ovládače (pretože štúdiové nepodporuje) 471.11 (aplikácie Topaz Labs a Adobe Lightroom Classic) a 466.47 (Blender). Zostavenie OS Windows 10 Enterprise je 19043.

AI aplikácie Topaz Labs

Vo všetkých prípadoch sa jedná o aplikácie na vylepšovanie kvality fotografií. Topaz DeNoise AI na „čistenie“ šumu z vysokého ISO, Gigapixel AI zase do vyšších rozlíšení efektívne prevzorkováva menšie výrezy a Sharpen AI zase fotky doostruje. Tieto aplikácie sú naprogramované primárne na využívanie AI procesora, ktorým môže byť CPU alebo radšej GPU s tensorovými jadrami.

Výber AI procesora je veľmi jednoduchý. Vo výkonnostných nastaveniach označíte buď CPU alebo GPU

Grafické karty z nižších tried používajú síce shadery (DirectML alebo DirectX), ale napríklad Gigapixel AI s akcelerátorom v podobe GeForce GT 1030 zlyhával a podobné správanie pravdepodobne nastane aj na výkonnejších GeForce GTX. Na GeForce RTX je ale všetko stabilné a na 3080 je výkonnostný rozdiel oproti akémukoľvek CPU naozaj markantný. 16-jadrový Ryzen 9 5950X je v Topaz Sharpen AI takmer 13× pomalší než RTX 3080, v Gigapixel AI potom 8× a i v DeNoise AI je to stále dosť (6×).



Adobe Lightroom Classic

RTX akcelerácia je obsiahnutá aj v Adobe Lightroom Classic. V najnovšej verzii 10.3 vylepšenie RAWov už však nenájdete pod „Enhance Details“, ale pod záložkou „Enhance“, ktorá obsahuje RAW Details (funkčne zodpovedá pôvodnému Enhance Detail zo starších verzií LR) a po novom (od v10.3) pribudlo doostrovanie „Super Resolution“ (zrejme to z Photoshopu), ktoré je možné s RAW Details kombinovať.

Tieto úpravy už CPU nepodporujú a ako môžete vidieť aj s výsledkov, s pomalou kartou sa na výsledky väčších dávkových úprav načakáte. Časy v našich testoch zodpovedajú práci iba na 42 fotkách s 20 Mpx vo formáte .CR2 (Canon) a teraz si prepočítajte, o koľko viac bude trvať úprava zo spoločenských akcií, ktoré sa fotia sekvenčne.


Fotky sú ale iba jedným z mnohých uplatnení RTX akcelerácie. V testoch sme im venovali viac priestoru iba pre relatívnu jednoduchosť otestovania. Niekoho ale môže zaujímať viac video. Aj na to má Topaz Labs aplikáciu Video Enhance AI a RTX akceleráciu podporuje aj dobre rozšírené Adobe Premiere Pro či DaVinci Resolve Studio na rozpoznávanie tvárí pre ich automatické označovanie alebo SpeedWarp fungujúci na báze neurónového engine. Videá spomaľuje aj pri zachovaní vysokých fps, ktoré sa dopočítavajú.

Tu je už ale otestovanie a porovnanie výkonu zložitejšie. V obidvoch aplikáciách sú to už pokročilejšie funkcie, ktoré PugetBench netestuje a vyžadujú vytvorenie si vlastných scén. Inými slovami treba určitú mieru používateľských zručností, ktoré zatiaľ nemáme, ale v budúcnosti sa k týmto témam ešte určite vrátime spolu s nejakou tou lepšou metodikou na otestovanie.

RTX akceleráciu podporuje aj Adobe Premiere Pro na strih videa

Zoznam aplikácií s podporou RTX (AI) nájdete aj na stránkach Nvidie. Je to síce zoznam všetkých aplikácií, ktoré podporujú akúkoľvek formu urýchľovania grafickou kartou, ale nájdete medzi nimi i dosť takých, čo využívajú práve tensorové jadrá. Vrátane mnohých na 3D renderovanie, ako je napríklad trojlístok Autodesku (3Ds Max, Arnold a Maya), D5 Render, Keyshot alebo renderovacie enginy V-Ray či OctaneRender. Najlepšie sa ale výkon pri renderovaní demonštruje v bezplatnom Blenderi. Ten pre renderer Cycles podporuje API OptiX.

Blender

Východiskový renderer Cycles OptiX dokáže poriadne nakopnúť. Na populárnej scéne BMW je výkon RTX 3080 Xtreme s  OptiX v porovnaní s CUDA vyšší až o až 46 %. Extrémne nižší výkon Ryzen 9 5900X tu ale skresľuje aj to, že je použitý projekt vhodný na testovanie GPU.

Iný, ale takisto často používaný render Classroom ilustruje praktickejšie porovnanie. Ale i v ňom je procesor Ryzen 9 5900X až 5× pomalší než RTX 3080 s OptiX.


RTX Studio ukazuje väčšiu komplexnosť GPU grafických kariet GeForce RTX. Tensorové jadrá nie sú iba o ray-tracingovej grafike v hrách a DLSS, ale tieto herné použitia výrazne presahujú a softvéroví vývojári by sa mohli upínať čoraz viac. A snáď sa nejaká forma RTX akcelerácie skôr či neskôr objaví aj v Affinity Photo ako v lacnej a podľa mnohých grafikov plnohodnotnej alternatíve k Photoshopu, ktorý už má nejaké „neurónové“ filtre má.

O využívaní jednotiek AI na zvyšovanie výkonu v aplikačnom prostredí sa príliš nepíše, ale my trochou pozornosti radi prispejeme a výhľadovo metodiku na testy grafických kariet osviežime niektorou z aplikácií Topaz Labs. Len teda ešte váhame, či sú pre vás atraktívnejšie tie na úpravu fotografií alebo videa. Ale asi nič nepokazíme tým, keď ich skombinujeme.

Výhody akcelerácie pomocou jadier Tensor majú GPU GeForce RTX a Quadro RTX. A hoci situácia na trhu je stále mrzutá, ale na skladoch sú hotové zostavy, notebooky a dokonca už i niektoré grafické karty. Vybrať si môžete z ponuky na Alza.sk.


  •  
  •  
  •  
Flattr this!

Nvidia DLSS (3.5) v Alan Wake II. Kdy hra běží nejlépe?

Alan Wake II je prvá hra, v ktorej sú od začiatku podporované Nvidia DLSS 3.5. Okrem technologickej stránky je tu aj vysoká popularita hráčov. Tým máme pokope základné dôvody na to, prečo sa podrobne pozrieť na fungovanie pri rôznych nastaveniach. V prieniku s herným výkonom sa budeme zaujímať nielen o vizuálnu stránku, ale aj spotrebu. Nielen grafickej karty, ale i procesora. Celý článok „Nvidia DLSS (3.5) v Alan Wake II. Kdy hra běží nejlépe?“ »

  •  
  •  
  •  

Minitest: Lacné zdroje vs. pískanie cievok grafických kariet

Veľkú analýzu vplyvu pískania cievok grafických kariet v závislosti od použitého zdroja už máte za sebou. Na to, aby za ňou šlo dať bodku, chýba ešte jedna vec. A tou je doplnenie správania sa lacných zdrojov s nižšou kvalitou súčiastok. V opačnom prípade by sa dalo stále špekulovať o tom, že naprieč triedami sa môže situácia výrazne odlišovať. Môže? Na to sa zameriame v meraniach so zdrojmi „80 Plus“, z ktorých jeden je už aj pomerne starý. Celý článok „Minitest: Lacné zdroje vs. pískanie cievok grafických kariet“ »

  •  
  •  
  •  

Aká kombinácia píska najmenej? 12 zdrojov, 3 grafické karty…

„Po výmene zdroja prestali pískať cievky grafickej karty“. Mimoriadne časté tvrdenie a pritom zostáva vždy iba na subjektívnej úrovni, čo je škoda. Ale aj preto sa teraz na veci pozrieme exaktným spôsobom, číselne. To otestovaním viacerých grafických kariet, kde sa pri každej sleduje hlučnosti cievok VRM v závislosti od použitého zdroja ATX (3.0). Ako je to s tým „pískaním“? Kedy je silnejšie a kedy slabšie? Celý článok „Aká kombinácia píska najmenej? 12 zdrojov, 3 grafické karty…“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *