Nvidia RTX Studio alebo keď CPU a grafické shadery nestačia

Čo je RTX Studio a ako môžu jadrá Tensor zvýšiť výpočtový výkon?

Názvoslovie RTX Studio Nvidia používa pri pracovných stolových počítačoch alebo pri notebookoch, ktoré majú výkonnú grafickú kartu GeForce RTX alebo Quadro RTX. Tá v určitých aplikáciách môže výrazne zvyšovať výpočtový výkon (a s ním aj produktivitu) zapojením tensorových jadier. Ako a kde takáto forma hardvérovej akcelerácie funguje si ukážeme v prehľadovom článku.

Upozornenie: Tento článok vznikol na objednávku Nvidie a je platený. Firma však nijakým spôsobom nezasahovala do jeho obsahu a jediná podmienka bola priblížiť čitateľom výhody platformy RTX Studio. Namerané výsledky v testoch sú naše vlastné.

Začneme úplne od podlahy, teda od toho, čo vôbec hardvérové urýchľovanie (alebo akcelerácia) je. Cieľom tohto článku je, aby sa v ňom zorientovali aj bežní používatelia, ktorí sa o hardvér zase až tak podrobne nezaujímajú, ale vysoký výpočtový výkon je pre ich prácu dôležitý.

Pod pojmom hardvérová akcelerácia sa rozumie zvýšenie aplikačného výkonu pomocou sily grafickej karty. Väčšina výpočtových úloh je ale i tak závislá na výkone procesora. Niektoré úplne (tzn., že hardvérovú akceleráciu nepodporujú), niektoré do významnej miery (a grafická karta počíta iba čiastkové úlohy), ale sú i také, čo CPU na svoj chod zase až tak nepotrebujú a výpočty bežia z drvivej väčšiny na grafickej karte.

Existujú tri formy hardvérovej akcelerácie. Jeden spôsob využíva grafický kodér (samostatný obvod, NVEnc, aktuálne v 7. generácii), druhý shadery (API DirectML, DirectX alebo CUDA) a tretí k nim ešte pridáva nové jednotky, ktoré pribudli do grafických kariet GeForce RTX a Quadro RTX – tensorové jadrá. A tých aplikácií, ktorú túto formu urýchľovania podporujú, je už pomerne dosť. Často sa táto RTX akcelerácia alebo TC akcelerácia, keď ju odvodíme od tensorových jadier, využíva iba na vybrané filtre, ale niektorí programátori si dali záležať a tieto jednotky (tensorové jadrá) využívajú pomerne efektívne.

Dobrá ukážka toho sú aj AI aplikácie Topaz Labs, ktoré urýchľovanie tensorovými jadrami podporujú. Poznať ich už môžete z našich testov procesorov, ktorých výkon si pri tejto príležitosti porovnáme s GPU GA102 v grafickej karte Aorus GeForce RTX 3080 Xtreme 10G s BIOSom OC.

Poznámka: Výkon grafických kariet je zaznamenávaný na platforme AMD s procesorom Ryzen 9 5900X. S Aorus RTX 3080 Xtreme 10G sú to vždy štúdiové. V aplikáciách Topaz Labs 471.11 a Adobe Lightroom Classic, v Blenderi sú to 462.31. S grafikou kartou GeForce GT 1030 sú použité už herné ovládače (pretože štúdiové nepodporuje) 471.11 (aplikácie Topaz Labs a Adobe Lightroom Classic) a 466.47 (Blender). Zostavenie OS Windows 10 Enterprise je 19043.

AI aplikácie Topaz Labs

Vo všetkých prípadoch sa jedná o aplikácie na vylepšovanie kvality fotografií. Topaz DeNoise AI na „čistenie“ šumu z vysokého ISO, Gigapixel AI zase do vyšších rozlíšení efektívne prevzorkováva menšie výrezy a Sharpen AI zase fotky doostruje. Tieto aplikácie sú naprogramované primárne na využívanie AI procesora, ktorým môže byť CPU alebo radšej GPU s tensorovými jadrami.

Výber AI procesora je veľmi jednoduchý. Vo výkonnostných nastaveniach označíte buď CPU alebo GPU

Grafické karty z nižších tried používajú síce shadery (DirectML alebo DirectX), ale napríklad Gigapixel AI s akcelerátorom v podobe GeForce GT 1030 zlyhával a podobné správanie pravdepodobne nastane aj na výkonnejších GeForce GTX. Na GeForce RTX je ale všetko stabilné a na 3080 je výkonnostný rozdiel oproti akémukoľvek CPU naozaj markantný. 16-jadrový Ryzen 9 5950X je v Topaz Sharpen AI takmer 13× pomalší než RTX 3080, v Gigapixel AI potom 8× a i v DeNoise AI je to stále dosť (6×).



Adobe Lightroom Classic

RTX akcelerácia je obsiahnutá aj v Adobe Lightroom Classic. V najnovšej verzii 10.3 vylepšenie RAWov už však nenájdete pod „Enhance Details“, ale pod záložkou „Enhance“, ktorá obsahuje RAW Details (funkčne zodpovedá pôvodnému Enhance Detail zo starších verzií LR) a po novom (od v10.3) pribudlo doostrovanie „Super Resolution“ (zrejme to z Photoshopu), ktoré je možné s RAW Details kombinovať.

Tieto úpravy už CPU nepodporujú a ako môžete vidieť aj s výsledkov, s pomalou kartou sa na výsledky väčších dávkových úprav načakáte. Časy v našich testoch zodpovedajú práci iba na 42 fotkách s 20 Mpx vo formáte .CR2 (Canon) a teraz si prepočítajte, o koľko viac bude trvať úprava zo spoločenských akcií, ktoré sa fotia sekvenčne.


Fotky sú ale iba jedným z mnohých uplatnení RTX akcelerácie. V testoch sme im venovali viac priestoru iba pre relatívnu jednoduchosť otestovania. Niekoho ale môže zaujímať viac video. Aj na to má Topaz Labs aplikáciu Video Enhance AI a RTX akceleráciu podporuje aj dobre rozšírené Adobe Premiere Pro či DaVinci Resolve Studio na rozpoznávanie tvárí pre ich automatické označovanie alebo SpeedWarp fungujúci na báze neurónového engine. Videá spomaľuje aj pri zachovaní vysokých fps, ktoré sa dopočítavajú.

Tu je už ale otestovanie a porovnanie výkonu zložitejšie. V obidvoch aplikáciách sú to už pokročilejšie funkcie, ktoré PugetBench netestuje a vyžadujú vytvorenie si vlastných scén. Inými slovami treba určitú mieru používateľských zručností, ktoré zatiaľ nemáme, ale v budúcnosti sa k týmto témam ešte určite vrátime spolu s nejakou tou lepšou metodikou na otestovanie.

RTX akceleráciu podporuje aj Adobe Premiere Pro na strih videa

Zoznam aplikácií s podporou RTX (AI) nájdete aj na stránkach Nvidie. Je to síce zoznam všetkých aplikácií, ktoré podporujú akúkoľvek formu urýchľovania grafickou kartou, ale nájdete medzi nimi i dosť takých, čo využívajú práve tensorové jadrá. Vrátane mnohých na 3D renderovanie, ako je napríklad trojlístok Autodesku (3Ds Max, Arnold a Maya), D5 Render, Keyshot alebo renderovacie enginy V-Ray či OctaneRender. Najlepšie sa ale výkon pri renderovaní demonštruje v bezplatnom Blenderi. Ten pre renderer Cycles podporuje API OptiX.

Blender

Východiskový renderer Cycles OptiX dokáže poriadne nakopnúť. Na populárnej scéne BMW je výkon RTX 3080 Xtreme s  OptiX v porovnaní s CUDA vyšší až o až 46 %. Extrémne nižší výkon Ryzen 9 5900X tu ale skresľuje aj to, že je použitý projekt vhodný na testovanie GPU.

Iný, ale takisto často používaný render Classroom ilustruje praktickejšie porovnanie. Ale i v ňom je procesor Ryzen 9 5900X až 5× pomalší než RTX 3080 s OptiX.


RTX Studio ukazuje väčšiu komplexnosť GPU grafických kariet GeForce RTX. Tensorové jadrá nie sú iba o ray-tracingovej grafike v hrách a DLSS, ale tieto herné použitia výrazne presahujú a softvéroví vývojári by sa mohli upínať čoraz viac. A snáď sa nejaká forma RTX akcelerácie skôr či neskôr objaví aj v Affinity Photo ako v lacnej a podľa mnohých grafikov plnohodnotnej alternatíve k Photoshopu, ktorý už má nejaké „neurónové“ filtre má.

O využívaní jednotiek AI na zvyšovanie výkonu v aplikačnom prostredí sa príliš nepíše, ale my trochou pozornosti radi prispejeme a výhľadovo metodiku na testy grafických kariet osviežime niektorou z aplikácií Topaz Labs. Len teda ešte váhame, či sú pre vás atraktívnejšie tie na úpravu fotografií alebo videa. Ale asi nič nepokazíme tým, keď ich skombinujeme.

Výhody akcelerácie pomocou jadier Tensor majú GPU GeForce RTX a Quadro RTX. A hoci situácia na trhu je stále mrzutá, ale na skladoch sú hotové zostavy, notebooky a dokonca už i niektoré grafické karty. Vybrať si môžete z ponuky na Alza.sk.


  •  
  •  
  •  
Flattr this!

Lacná a odteraz ešte lacnejšia RTX 3050 – MSI Ventus 2X 8G OC

Okrem globálneho poklesu cien všetkých grafických kariet teraz MSI znižuje aj odporúčanú cenu RTX 3050 Ventus 2X (OC) zo svojho najnižšieho radu. Fráza „cenovo dostupná grafická karta“ tak dostáva nový náboj a pokiaľ ste niekde čítali, že prevádzkové vlastnosti grafických kariet Ventus nestoja za veľa, zabudnite na to. Nám to takto rozhodne nevychádza a maloktorá RTX 3050 za tieto peniaze sa môže pýšiť funkčne atraktívnejším vyhotovením. Celý článok „Lacná a odteraz ešte lacnejšia RTX 3050 – MSI Ventus 2X 8G OC“ »

  •  
  •  
  •  

Extra tichý chod v high-ende, chladič Noctua je už aj na RTX 3080

Béžovo-hnedá RTX 3070 NE zožala u kupujúcich úspech a po tejto premiérovej grafickej karte Noctua s Asusom dali dokopy aj RTX 3080. Určená je pre tých požívateľov, ktorých účinný chladič Noctuy síce oslovil, ale výkon GPU už vyhodnotili ako „nedostatočný“. Jadro (GA102) RTX 3080 je však už výkonnejšie a stále sa má jednať o suverénne najtichšiu grafiku vo svojej triede. To nielen vďaka robustnému pasívu, ale aj pre špičkové ventilátory. Celý článok „Extra tichý chod v high-ende, chladič Noctua je už aj na RTX 3080“ »

  •  
  •  
  •  

Radeon RX 6650 XT s AMD SAM: +6 % výkonu za 20 W

Na deň vydania refreshu Radeonov RX 6000 sme ich nestihli, ale už ich máme – testy výkonu s aktívnym Resizable BAR. Väčšinou je táto technológia užitočná, ale v niektorých prípadoch i škodí. Výsledky testov pritom dobre ukazujú, ako túto technológiu AMD naprieč rôznymi verziami ovládačov ladí, optimalizuje, sem-tam pre zmenu niečo pokazí, neopraví. V početnej prevahe, a pomerne drvivej, sú však zlepšenia. Celý článok „Radeon RX 6650 XT s AMD SAM: +6 % výkonu za 20 W“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *