Proč je Zen 4 tak rychlý v AI aplikacích Topaz Labs? Kvůli Intelu

Ryzeny 7000 s architekturou Zen 4 jsou první generace procesorů AMD, která podporuje 512bitové vektorové instrukce AVX-512. Už jsme tu probírali jejich větší či menší přínosy. Jádra Zen 4 ale podporují další instrukční rozšíření, které bývalo chloubou Intelu a teď se u něj trošku obrátily role: VNNI. Vypadá to, že v řadě programů přináší hodně radikální zlepšení výkonu a tentokrát nevadí, že zatím AMD má jen 256bitové jednotky SIMD.

O instrukcích VNNI (Vector Neural Network Instructions) jste možná dřív slyšeli pod označením DL Boost. Toto označení pod sebe zahrnovalo 512bitové instrukce VNNI, také někdy označované jako AVX512_VNNI na jedné straně, a podporu operací s čísly ve formátu BFloat16 (AVX512_BF16) na straně druhé. Druhé rozšíření měly serverové Xeony Cooper Lake, to první (VNNI), pak bylo Intelem notně inzerováno u 10nm procesorů Ice Lake a Tiger Lake (Core 10. a 11. generace pro notebooky).

Intel sliboval, že instrukce VNNI razantně navýší výkon těchto procesorů v operacích neuronových sítí, tedy v „AI“ aplikacích, pro které jsou tyto instrukce explicitně navržené. Měly by používat 16bitovou a 8bitovou přesnost (s celočíselnými hodnotami), které se hodí pro inferenci, tedy pro aplikaci už natrénované sítě. Firma tehdy získala coby partnera firmu Topaz Labs, která pomocí VNNI (skrze framework OpenVINO) zoptimalizovala své aplikace (Gigapixel AI, Denoise AI, Video Enhance AI…).

A Intel pak programy Topaz Labs ukazoval ve svých oficiálních benchmarcích, kde dávaly čtyřjádrovým mobilním procesorům vyšší výkon, než by jim normálně příslušelo. Tehdy to byla značná výhoda proti konkurenčním procesorům bez VNNI.

Upscaling pomocí AI od Topaz Labs (zdroj: Intel)

Dřív výhoda pro Intel, teď pro konkurenci

S příchodem Zenu 4 se ale v tomhle docela obrací karta. Paradoxně se stalo, že Intel odebral podporu instrukcí AVX512_VNNI z procesorů Alder Lake, protože používají 512bitové registry a jsou jedním ze subsetů AVX-512 (byť hodně specifickým). Jenže jádro AMD Zen 4 je zase přidalo, takže teď nastala situace, kdy je výhoda na jejich straně.

V aplikacích Topaz Labs jsme v našich recenzích skutečně pozorovali výkon, který je vysoce nad průměrem Ryzenů 7000 v ostatních programech. Ryzen 9 7900X byl o 90–126 % rychlejší než Ryzen 9 5900X, ale podobnou doslova čočku dostaly i procesory Alder Lake – proti těm je Ryzen 9 7900X v těchto testech rychlejší o 75–95 %, což jinde opravdu nebývá. A přitom ještě nejde o nejvýkonnější model, který AMD má. Uvidíme, zda bude Ryzen 9 7950X škálovat ještě výš. Nicméně už i Ryzen 5 7600X také má hodně vysoký výkon.

Benchmarky Zenu 4: AI aplikace Topaz Labs

Takto mimořádný nárůst výkonu u Zenu 4 by byl až podezřelý, ale z článku o AVX-512 si možná pamatujete, že Phoronix našel řadu testů používajících také framework OpenVINO a zřejmě instrukce VNNI, kde Zen 4 až dvojnásobné zrychlení dosáhl. Vysvětlení je tedy zřejmě: ač byla akcelerace aplikací Topaz Labs původně určená pro procesory Intel, na Ryzenech 7000 je také automaticky zapnutá.

Tip: AVX-512 na Ryzenech 7000: jak užitečné je a je implementace od AMD lepší než od Intelu?

Zeptali jsme se na to přímo v Topaz Labs coby autorů a bylo nám potvrzeno, že tyto programy opravdu na Zenech 4 podporu VNNI využívají. A tyto instrukce také přes to, že AMD AVX-512 implementovalo pomocí 256bitových jednotek, evidentně mají dost vysoký výkon, aby to stálo zato. Tato skóre tedy nejsou nějakou divnou anomálií, ale ukazují legitimní výsledek – zrychlení je tak anomální proto že jde o specifickou akceleraci a ne obecný kód.

Podle informací od Topaz Labs by jejich aplikace měly využívat i formu VNNI, která se označuje AVX2_VNNI nebo také VNNI/256. Ta vznikla pro procesory Alder Lake. Protože u nich Intel vypnul AVX-512, musely být deaktivované také instrukce VNNI využívající stejné 512bitové registry. Malá jádra Gracemont je totiž nemají a podporují jen AVX2 (navíc asi se 128bitovými jednotkami). Kvůli užitečnosti VNNI ale Intel vyrobil zmíněnou verzi AVX2_VNNI, která pracuje s 256bitovými registry. Má však asi poloviční výkon (jenže to by měl mít i Zen 4), a také asi bude pomalejší na malých jádrech než na P-Core Golden Cove.

Slajd Intelu inzerující vysoký výkon AI aplikací Topaz Labs, umožněný instrukcemi AVX512_VNNI procesorů Ice Lake a Tiger Lake (zdroj: Intel)

A jak ukazují výsledky Core i9-12900K, ten nižší výkon AVX2_VNNI proti implementaci v Zenu 4 není legrace. Původně jsme uvažovali o tom, zda třeba AI aplikace Topaz Labs neignorují instrukce AVX2_VNNI v Alder Lake, ale podle firmy jsou také použité (leda že by jejich detekce a využití bylo implementováno až v pozdější verzi, než používá naše metodika). Na druhou stranu, poměrně nízko vychází i výkon dalších procesorů Intelu, které by měly mít původní 512bitovou verzi VNNI v plné palbě (Rocket Lake, například Core i9-11900K). U těch není vidět podobný brutální nárůst výkonu proti předchůdci (Core i9-10900K).

Kdo ví, zda teď Intel nelituje, že akceleraci programů přes VNNI a OpenVINO podporoval, když nyní vidí, jak z ní – aspoň pro tuto chvíli – nejvíc profituje konkurence…

Zdroje: Topaz Labs, Intel

Jan Olšan, redaktor Cnews.cz

⠀⠀

Súvisiace články

Dostanou integrované grafiky v Ryzenech FSR 4.1? Není to jasné

Grafiky, Správy | 12. 6. 202612. 6. 2026 | Jan Olšan

Před nedávnem přišla příjemná zpráva pro majitele grafických karet Radeon se staršími architekturami RDNA 3 a RDNA 2. AMD totiž sdělilo, že jim přece jenom dopřeje AI upscaling FSR4 (přesněji už vylepšenou verzi FSR 4.1) doteď dostupný jen Radeonům RX 9000. Když byla tato zpráva vydána, počítali jsme, že se FSR 4.1 dostane i na integrovaná GPU s architekturami RDNA 3 a 3.5, používané i různými herními handheldy. Ale možná to tak nebude. Celý článok „Dostanou integrované grafiky v Ryzenech FSR 4.1? Není to jasné“ »

Nové Radeony jsou daleko. RDNA 5 GPU mohou vyjít až za rok a půl

Grafiky, Správy | 9. 6. 20268. 6. 2026 | Jan Olšan

Každoroční veletrh Computex je sice hlavně největší počítačovou výstavou roku (vedle CES v lednu) a příležitostí pro oficiální propagaci, ale přítomnost zástupců firem je někdy také možnost k únikům a získávání neoficiálních zpráv přímo od zdrojů. Nizozemský web Tweakers.net ho využil k tomu, aby se poptal zástupců různých výrobců karet na to, jak to vypadá s novou generací grafik, konkrétně s grafikami Radeon s novou architekturou RDNA 5. Celý článok „Nové Radeony jsou daleko. RDNA 5 GPU mohou vyjít až za rok a půl“ »

Nový Ryzen 7 5800X3D není omezená edice, výroba znovu začala

Procesory, Správy | 5. 6. 20265. 6. 2026 | Jan Olšan

AMD teď oznámilo návrat Ryzenu 7 5800X3D, jenž se stal legendou coby první herní procesor s 3D V-Cache povyšující výkon herního PC. Což se zvlášť hodí, pokud máte desku se socketem AM4, která bez 3D V-Cache už dnes ve hrách často dostává čočku. Ta legenda ale byla do značné míry posmrtná, jelikož se procesor už dlouho neprodává. Nové vydání ale není jenom poslední limitovaná série. AMD prý obnovilo výrobu, která snad pojede delší dobu. Celý článok „Nový Ryzen 7 5800X3D není omezená edice, výroba znovu začala“ »

Pridaj komentár Zrušiť odpoveď

epidot on Rakúska sova roztiahla krídla – očakávané novinkyTož jaká 🫣 🦉🦉🦉?
the patient on Desky pro Nova Lake s větráky na čipsetu? Z990 má spotřebu 14 WPravda, mám v hlavě zafixované schéma Alder Lake a pletu si jej s Arrow Lake....
Jan Olšan on Desky pro Nova Lake s větráky na čipsetu? Z990 má spotřebu 14 WNova Lake budou mít řadič Thunderboltu 4/5 v procesoru (Arrow Lake také už mají TB4),...
the patient on Desky pro Nova Lake s větráky na čipsetu? Z990 má spotřebu 14 WIntel asi využije pokročilejší výrobní technologie, ale právě u nejvyššího modelu mají být k dispozici...
Ľubomír Samák on Desky pro Nova Lake s větráky na čipsetu? Z990 má spotřebu 14 WIsteže, určite môže a ten podiel bude zrejme pomerne výrazný. Značí to aj prítomnosť chladiča...
the patient on Desky pro Nova Lake s větráky na čipsetu? Z990 má spotřebu 14 WMůže to být taky tím, že bude mít integrovaný USB4 řadič.
Ľubomír Samák on Desky pro Nova Lake s větráky na čipsetu? Z990 má spotřebu 14 WTo bude viac, tých 14 W, ako má v nečinnosti viacero procesorov... ... ale zase...
Ľubomír Samák on BeQuiet! sú aj periférie, klávesnice a myši. Headsety nebudúHmm, nejaká klávesnica alebo zdroj? Je to trochu dilema, čo by sa lepšie vynímalo v...
Ľubomír Samák on Asus ROG Equalizer: Robustnější 12+4pinové konektory, co nehoří?Pod druhú a tretiu vetu sa podpisujem. :)

Proč je Zen 4 tak rychlý v AI aplikacích Topaz Labs? Kvůli Intelu

Dřív výhoda pro Intel, teď pro konkurenci

Benchmarky Zenu 4: AI aplikace Topaz Labs

Contents

Dostanou integrované grafiky v Ryzenech FSR 4.1? Není to jasné

Contents

Nové Radeony jsou daleko. RDNA 5 GPU mohou vyjít až za rok a půl

Contents

Nový Ryzen 7 5800X3D není omezená edice, výroba znovu začala

Contents

Pridaj komentár Zrušiť odpoveď

Posledné komentáre