Procesory s jádry Zen 5 pro desktop odhalené
Po dlouhém čekání je to tady. AMD během prezentace na Computexu 2024 představilo procesory Ryzen 9000 pro desktop, které jsou prvními z generace CPU založených na architektuře Zen 5. Máme tak potvrzené modely a také IPC (alespoň tedy oficiálně udávané) této architektury. Podle AMD jsou to nejrychlejší procesory dneška pro „spotřebitelská PC“, přičemž firma už ukázala i první testy, ovšem ne nezávislé.
Architektura Zen 5: Největší změny v jádru od prvního Zenu
O samotných architektonických detailech toho zatím nebylo odhaleno mnoho a více se možná dozvíme až s recenzemi v červenci nebo v srpnu, kdy bude jádro prezentováno na konferenci Hot Chips (kde by to už mělo být s hlubšími detaily). AMD potvrdilo, že jde o nově od základu navržené jádro, jako byl první Zen a Zen 3, nikoliv o evoluci Zenu 4. Zdá se, že rozsah změn je větší než u Zenu 3. Zen 5 má skloubit „velmi vysoký výkon“ a „extrémní energetickou efektivitu“, ale za tím se samozřejmě může schovávat cokoliv, takže v těchto věcech bude třeba počkat na nezávislé testy.
Možná nejzajímavější rys Zenu 5, který byl odhalen, je použití dvou paralelních pipeline ve frontendu. Teoreticky by to mohlo být něco podobného paralelním klastrům dekodérů v malých jádrech Intelu (Tremont, Gracemont a Skymont, který by měl být brzo také odhalen a má paralelně dokonce 3 × 3 dekodéry). Zdvojené by ale mohly být jiné části pipeline než dekódování instrukcí, takže toto berte jen pro ilustraci.
Účelem těchto zdvojených pipeline ve frontendu je, aby procesor uměl lépe zpracovávat větvení v kódu programu – s vyšší přesností a také menší prodlevou, aby se co nejvíce zmenšily prodlevy v práci a prostoje samotných vykonávacích jednotek, které větvení způsobuje.
Jádro má také mít větší výpočetní kapacitu v backendu (tedy samotných vykonávacích jednotkách). Toto už zřejmě hovoří o přidání dalších ALU do jádra (mělo by jich být šest místo dosavadních čtyř, ale AMD to ještě oficiálně nepotvrdilo).
Také by Zen 5 měl obnášet rozšíření SIMD jednotek na plnou nativní šířku operací AVX-512, tedy z 256 bitů na 512 bitů. To zdvojnásobuje teoretický výpočetní výkon v SIMD kódu – za podmínky použití instrukcí AVX-512, ovšem – protože 512bitové instrukce budou provedené v jednom cyklu místo ve dvou, ale v programech se typicky může projevit jen část tohoto „2ד potenciálu. V silně optimalizovaných úlohách využívajících plně vektorizaci, numerických výpočtech a mikrobenchmarcích ovšem toto navýšení být vidět může.
Další místo, kde je (lokálně) výkon až dvojnásobný, je datová propustnost. Ta byla zvětšená na dvojnásobek mezi L1 a L2 cache a dvojnásobná je také datová propustnost mezi datovou L1 cache a vykonávacími jednotkami SIMD/FPU. Toto by mělo zajišťovat, aby kód využívající onoho dvakrát vyššího výkonu AVX-512 nebyl limitován tím, že data ke zpracování nebudou stíhat proudit z pamětí cache a zpátky do nich. Toto zdvojnásobení propustnosti by asi mělo být realizováno rozšířením datových cest na dvojnásobek, load/store pipeline patrně již provádějí 512bitová čtení a zápisy za jeden cyklus.
AMD také mluví o „dvojnásobné propustnosti instrukcí“ ve frontendu. Není úplně jasné, zda je řeč o čtení instrukcí z L1 cache („fetch“), nebo o dekódování (což by znamenalo osm instrukčních dekodérů, nebo 2×4, pokud jsou ve dvou klastrech), nebo o schopnosti provádět větvení, tedy zpracování dvojnásobného množství větvení za jeden cyklus.
Naopak kapacity mezipamětí L2 cache zůstaly na 1 MB (privátní v každém jádru) a u L3 cache je stále použitá kapacita 32 MB v každém z čipletů. Dvoučipletové modely mají tedy 64 MB, jednočipletové 32 MB.
Jádro by také mělo mít prohloubené buffery a fronty out-of-order vykonávání instrukcí včetně tzv. Reorder Bufferu (RoB), který představuje „okno“ kódu, v jehož rámci procesor může přehazovat instrukce a počítat dopředu ty, které nemají závislosti. Jádra Zen měla dosud relativně málo hluboké RoB, kdy třeba mezi Zenem 3 a Golden Cove od Intelu byl dvojnásobný rozdíl (256 versus 512 položek). Bude zajímavé vidět, jak moc v tomto Zen 5 poskočí dopředu.
První oficiální údaje o IPC
Všechny z těchto změn by se měly podílet na zlepšeném IPC jádra, čímž se myslí zlepšení výkonu na 1 MHz frekvence. Přínosy ale možná nebudou tak vysoké, jak by někdo čekal vzhledem k tomu, jak velké změny v architektuře Zen 5 obnáší. To by možná mohlo být právě novostí designu.
Zen 4 stavěl na osvědčeném designu Zenu 3 a měl větší prostor k opravám slabších míst nebo chyb a k řešení výkonnostních omezení, která byla odhalena při práci na Zenu 3, ale nestihla v něm už být adresována. Naproti tomu tím, že je Zen 5 tak nový návrh, asi bude obsahovat více případů, kdy takové nově odhalené limity ještě nejsou vyřešené a jde o příležitosti ke zlepšení v dalších generacích – minimálně v Zenu 6, který by asi měl přijít opět za rok a půl až dva roky.
AMD na Computexu ukázalo graf s různými benchmarky a nárůstem IPC v nich pro Zen 5 v porovnání s předchozí generací Zen 4. Tato zlepšení jsou od +10 % (ve hře Far Cry 6) až po +23 % (Blender) a +35 % (kryptografie AES XTS v testu Geekbench 5.4, tento test profituje z AVX-512).
Poznámka: Nejde zřejmě o striktně jednovláknové aplikace, na které jsme většinou v měření IPC zvyklí, ale o mnohovláknové. Test by měl být při 4,0 GHz frekvenci. Je mimochodem uvedeno, že pro Zen 4 byl použitý osmijádrový procesor Ryzen 7 7700X, což ale nedává smysl (leda že by u Ryzen 9 9950X byla použitá jen polovina jader a šlo tedy o test 8 jader / 16 vláken u obou CPU).
+16 % výkonu při stejné frekvenci
Celkově z toho má vycházet geometrický průměr +16 %, tedy o něco málo víc, než stálo v před časem uniklých slajdech. Podle těch AMD předpokládalo či slibovalo, že zlepšení výkonu na 1 MHz (IPC) u Zenu 5 bude v rozsahu 10–15+ %. Dalo se předpokládat, že reálně AMD chce dosáhnout na o něco více, než je horní konec rozsahu, a nyní oznámená hodnota +16 % je těsně nad.
Je ale možné, že ne všechno s novým jádrem vyšlo úplně podle představ, vzhledem k tomu, že toto „předstižení“ je jen o jediný procentní bod (vzpomeňme, že pro Zen 3 uvádělo AMD +19 %). Je otázka, jestli AMD trošku nevylepšilo onen průměr na 16 % volbou testů, které do tohoto grafu a průměru zahrnulo. Poněkud otázky budící je třeba to, že nebyly zahrnuté přímo testy Geeekbench 5 a Geekbench 6, ale jen jejich konkrétní subtesty. To by mohlo být proto, aby výsledné procento vypadalo lépe. Na druhou stranu ale pravděpodobně budou i testy, kde bude nárůst vyšší než těch +35 %, očekávali bychom, že by se dala najít ještě vyšší čísla z aplikací stojících na AVX-512. Každopádně lepší bude počkat na reálné testy.
Stále pro AM5 , nové CPU čiplety se starým IO čipletem
Šéfka AMD Lisa Su ukázala na Computexu vzorek procesoru bez kovového krytu, který potvrzuje, že desktopové procesory Ryzen 9000 (jejichž kódové označení je Granite Ridge) jsou stále konstruované čipletově – s jedním IO čipletem a dvěma CPU čiplety na klasickém substrátu (pokročilé pouzdření, které by mohlo zlepšit energetikou efektivitu, bude nejdříve u Zenu 6). Nové by měly být právě ty CPU čiplety s jádry Zen 5, které používají 4nm proces TSMC (N4).
IO čiplet je patrně stejný (vyráběný 6nm procesem TSMC, N6), takže je zachován stejný řadič PCI Expressu s 16 + 4 + 4 linkami a řadič DDR5 s šířkou 128 bitů (postaru „dvoukanálový“). Nově je ale oficiálně podporovaná frekvence pamětí DDR5-5600, zatímco u Ryzenů 7000 to bylo jen DDR5-5200. Zůstává naopak integrované GPU se 128 shadery architektury RDNA 2 na frekvenci 2200 MHz.
Stále je použitý socket AM5, tyto procesory by se měly dát použít jako upgrade v kterékoli AM5 desce. Jako dosud jsou všechny modely odemčené pro přetaktování a v balení nebudou mít přiložený chladič. Maximální provozní teplota je mimochodem 95 °C, jako v předchozí generaci.
Čtyři procesory, 65W, 120W a 170W TDP
Také modely již byly odhaleny a jsou to přesně ty čtyři procesory s 6, 8, 12 a 16 jádry, jejichž parametry unikly již o víkendu – teď už ale máme i předtím chybějící údaje, takže následující odstavce nemusíte přeskakovat.
Špičkou nabídky je Ryzen 9 9950X s 16 jádry Zen 5 a 32 vlákny. Jeho maximální boost je 5,7 GHz – nezměněný proti Ryzenu 9 7950X s architekturou Zen 4. Procesor má 32 MB L3 cache v každém ze dvou CPU čipletů, ze kterých se procesor bude skládat, celkem tedy 64 MB. A zůstalo také 170W TDP, které implikuje, že maximální boostovací (ovšem trvale konzumovatelná) spotřeba je 230 W.
Základní frekvence je 4,3 GHz, což je o 200 MHz méně než u Ryzenu 9 7950X v předchozí generaci. Zen 5 má sice CPU čiplety vyráběné na 4nm procesu, nicméně kvůli komplexní architektuře asi na určité dané frekvenci může mít o něco vyšší spotřebu. Minimálně by to asi mohlo platit při použití instrukcí AVX-512 vzhledem k dvojnásobně širokým 512bitovým jednotkám. Základní frekvence asi může být snížena z tohoto důvodu.
Druhý model v nabídce je Ryzen 9 9900X s 12 jádry a 24 vlákny. Opět má 2 × 32 MB L3 cache a jeho maximální boost je 5,6 GHz. Takt boostu je tedy opět nezměněný proti modelu 7900X z roku 2022. Tento model ale spadá do úspornější třídy spotřeby, místo 170 W bude TDP 120 W (skutečně maximální spotřeba PPT je 170 W). Tento model má také o 300 MHz nižší základní takt, jen 4,4 GHz. Vzhledem ke sníženému TDP je to však zde snadno pochopitelné.
Také zbylé dva modely s jedním CPU čipletem mají nižší TDP. Ryzen 7 9700X má 8 jader s 16 vlákny, 32MB L3 cache a TDP je 65 W (maximální spotřeba PPT je 88 W). Maximální boostová frekvence procesoru je 5,5 GHz, tentokrát je to už 100MHz zlepšení proti předchozí generaci. Základní takt je 3,8 GHz, což je ale zase dost velké snížení (7700X má základ 4,5 GHz).
Nejlevnější model, Ryzen 5 9600X, bude stále jen s šesti jádry a 12 vlákny. I zde je 65W TDP a 32MB L3 cache. I tomuto procesoru AMD navýšilo o 100 MHz maximální boost, který bude oficiálně 5,4 GHz (model 7600X má 5,3 GHz). Základní takt se ale proti 105W Ryzenu 5 7600X snížil ze 4,7 na jen 3,9 GHz.
Základní takty těchto 65W modelů bychom asi měli srovnávat spíše s také 65W modely generace Zen 4 – Ryzen 7 7700 má základ 3,8 GHz a Ryzen 5 7600 také. Proti nim to už tedy drastický pokles nebude.
První oficiální benchmarky
AMD ukázalo i nějaké oficiální benchmarky Ryzenu 9 9950X, které můžete vidět na následujícím slajdu. Jde o testy pořízené proti konkurenčnímu 8+16 jádru Intel Core i9-14900K. Relativně menší vítězství má Zen 5 v benchmarkovacích nástrojích Procyon Office (+7 %) a Puget Photoshop (+10 %), zatímco v programech, které patrně profitují z AVX-512, je to až +55–56 % (Handbrake, Blender). Zajímavý ukazatel by mohl být mnohovláknový test Cinebench R24, v kterém je výkon lepší o 21 % proti procesoru Intelu.
Ve hrách by AMD podle svého slajdu mělo mít „vedení“, Ryzen 9 95950X je rychlejší proti Core i9-14900K o +4 % až +23 % v závislosti na měřených hrách. Toto by mělo být s použitím pamětí DDR5-6000 na obou platformách.
Pozor – procesor Core i9-14900K bude mít asi v tomto testování (které provádělo AMD) o trošku horší výkon než při svých původních recenzích z podzimu, protože je nastavený na hodnoty „Intel Defaults“. To je změna, kterou nyní Intel zpětně provádí s výrobci desek kvůli problémům s nestabilitou (což nám připomíná, že zatím nepřišlo ono oficiální vyjádření k příčinám a řešení problému, jen ony upravené BIOSy od výrobců desek). To, že AMD použilo tato nastavení, a ne v podstatě přetaktované hodnoty dříve používané deskami, se v situaci, kdy Intel sám předepisuje používání těchto nastavení, ale zdá být zcela legitimní.
Mějte však na paměti, že takovéto oficiální benchmarky mohou být přikrášlené různými volbami nastavení sestav nebo výběrem testů, kterou jsou zahrnuté, a testů, které jsou vynechané. Proto čísla zatím berte s rezervou a počkejte raději na nezávislé testy.
Vydání v červenci, ceny zatím neznáme
Vydání Ryzenů 900 zatím nebylo přislíbeno na přesný den, ale proběhne někdy příští měsíc, to už oficiálně řečeno je. Tehdy by už procesory měly jít přímo do obchodů. Zatím není jasné, zda se ceny těchto procesorů dozvíme až ve chvíli, kdy půjdou do prodeje, nebo budou oficiálně oznámené s nějakým předstihem. Také recenze by asi mohly vyjít dříve, o datu jejich vydání zatím nic nevíme.
Zdroje: AMD (1, 2, 3), AnandTech
Jan Olšan, redaktor Cnews.cz
⠀