Zen 5: Nejinovativnější jádro AMD od Zenu 1 [nově doplněný rozbor]

Upgrade vykonávacích jednotek II: AVX-512 naplno

Jsou to zhruba dva týdny do vydání procesorů AMD s novou architekturou Zen 5. Tento týden jsme se k těmto CPU dozvěděli konečně pořádné podrobnosti o jejich samotné architektuře, které AMD zveřejnilo na akci Tech Day. Už tedy můžeme rozebrat změny, které firma udělala v jádru oproti Zenu 4 – a že jsou hodně rozsáhlé, asi více, než se v červnu zdálo. A firma také zopakovala příslib 16% zvýšení IPC u těchto procesorů.

FPU: Nejsilnější SIMD na trhu a doteď nejlepší implementace AVX-512

Nicméně, informace o kapacitě load/Store pipeline na předchozí straně platí pro čtení a zápisy do základní aritmeticko-logické části. Jednotka FPU a SIMD, která má své vlastní registry, je poněkud vydělená (toto „koprocesorové“ řešení teď už v novém jádru Lion Cove používá i Intel, který měl dlouho ALU a FPU unifikovanou) a má schopnost provádět jen dvě čtení či dva zápisy. U čtení jsou podporována až dvě 512bitová čtení (přičemž 512 bitů je šířka registru instrukcí AVX-512), protože datové šířky cest do L1 datové cache byly zdvojnásobené. Zápisy lze provést dva 256bitové nebo 128bitové za cyklus, nebo jeden 512bitový za cyklus.

Toto rozšíření a tím zdvojnásobení datové propustnosti mezi jádrem a L1 cache je samozřejmě uděláno proto, že AMD u Zenu 5 upgradovalo pipeline v jednotce SIMD/FPU. Ty byly od Zenu 2 až po Zen 4 s šířkou 256 bitů, takže uměly provést jednu instrukci AVX nebo AVX2 jedním průchodem, ale Zen 4, který už uměl i AVX-512 s 512bitovou šířkou, je musel počítat dvěma průchody. Zen 5 rozšířil jednotky na dvojnásobnou 512bitovou šířku. To znamená, že počet operací SSEx a AVX/AVX2 možných za cyklus se sice nezměnil, ale instrukcí AVX-512 může jádro provést dvojnásobek. Takže při využívání instrukcí AVX-512 v programech bude možné ze Zenu 5 dostat vyšší výkon.

Počet pipeline zřejmě zůstal stejný a je jich šest, nicméně ne všechny mají všechny schopnosti a část provádí instrukce jako load/store nebo konverze. Instrukcí FMA nebo floating-point násobení dokáže jádro provést dvě za cyklus (včetně 512bitových AVX-512), floating-point sčítání (FADD) lze udělat také dvě. Ovšem jednoduché celočíselné SIMD operace, jako je sčítání, jsou možné čtyři za cyklus. Změna k lepšímu je také, že instrukce FADD mají latenci dva cykly místo dřívějších tří.

Až šest operací za takt lze provést, pokud jde o kombinaci násobení/FMA, sčítání a load/store operací. Není to tedy tak, že by Zen 5 (a podobně Zen 4 před ním) měl šest pipeline, z nichž každá by byla „všehoschopná“.

Prezentace architektury Zen 5, Granite Ridge a Strix Point (Autor: AMD, via: ComputerBase)

Nicméně když se vezme v potaz to, že jádro u všech operací může zpracovávat 512bitový vektor, znamená to, že jádro Zen 5 by mělo mít nejvýkonnější SIMD ze všech konkurentů. Intel má (respektive bude mít) v jádru Lion Cove čtyři 256bitové pipeline (které tedy zvládnou jen polovinu výpočtů za cyklus), Apple má čtyři pipeline se 128bitovou šířkou (a tedy jen čtvrtinovým výpočetním výkonem) a ARM u jader Cortex-X925 sice má šest pipeline, které jsou univerzálnější, ale stále jen se 128bitovou šířkou.

Zen 5 by tedy měl být velmi atraktivní jádro pro úlohy silně využívající instrukce SIMD a také dost možná bude procesorem, který bude mít nejlepší schopnosti vykonávání instrukcí AVX-512 ze všech dosavad uvedených. Ovšem pozor: Toto bude patrně platit jen pro serverovou a pro desktopovou verzi, tedy Ryzeny 9000. AMD to sice oficiálně nepotvrdilo, ale zdá se, že mobilní procesory Ryzen AI 300 mají jádro upravené tak, že obsahuje v FPU menší počet SIMD pipeline – ty jsou sice stále 512bitové, ale v menším počtu, což výkon v takovém softwaru samozřejmě nějak omezí. Jak moc, to ukážou benchmarky po vydání.

Aktualizováno: Zdá se, že rozdíl mezi desktopovým (respektive serverovým) a mobilním jádrem Zen 5 nakonec nespočívá v počtu pipeline, ale v šířce jednotek. AMD uvádí, že jak jádro Zen 5, tak jádro Zen 5c implementované v APU Strix Point (Ryzenu AI 300) má fyzicky 256bitové jednotky AVX-512, tedy podobné Zenu 4, místo plně 512bitových, jaké mají jádra (Zen 5, ale i Zen 5c) pro desktop a servery.

Toto je umožněno tím, že Zen 5/Zen 5c ve skutečnosti podporuje konfigurovatelnou šířku SIMD jednotek. Šířka se dá zvolit při návrhu čipu. 512bitová šířka jednotek SIMD pro AVX-512 coby jedna z hlavních novinek Zenu 5 tedy platí jen pro některé procesory. I v 256-bitové implementaci je ale zůstává 512bitová šířka load-store datových cest do L1 cache, pouze samotné vykonávací jednotky mají poloviční šířku.

Nové instrukce podporované jádrem Zen 5 oproti Zenu 4 (Autor: AMD, via: ComputerBase)

Ještě je třeba říct, že FPU/SIMD má vlastní scheduler, respektive schedulery. AMD u ní totiž dál používá tři rozdělené schedulery o 32 položkách (jeden pro dvojici pipeline), což je ale změna proti Zenu 4, kde byly schedulery jen dva (vždy pro trojici pipeline) také o 32 položkách, takže celková kapacita těchto front je o polovinu větší.

Zde tedy AMD šlo opačným směrem, údajně proto, že kód běžící na jednotce SIMD je mnohem více pravidelný, opakující se a předvídatelný proti chaotičtějšímu kódu, který musí chroustat aritmetickologická část, takže je snazší ho řešit v rozdělených schedulerech (ze stejného důvodu bylo také snazší zvětšit počet SIMD/FPU registrů o 100 %).

Před schedulery má jednotka FPU ale ještě předřazenou delší frontu NSQ (Non-Scheduling Queue). Ta se také prohloubila o 50 % z 64 na 96 položek. Tyto fronty, kterými instrukce prochází, pomáhají schovat latence instrukcí, a zejména latence, které by vznikaly čekáním na data, která mezitím mohou být přinesena do cache díky prefetchingu.

Článek pokračuje na další straně.



  •  
  •  
  •  
Flattr this!

Přichází levnější ARM procesory s jádry „Nuvia“ pro notebooky

Před nedávnem se objevily zprávy o tom, že Qualcomm chystá další ARM procesor pro notebooky, který by rozšířil nabídku směrem dolů, a počítače s ARMem a Windows by se tím dostaly na o něco nižší počáteční cenu. Teď Qualcomm skutečně vydal nové modely procesorů Snapdragon X Plus, a je jich dokonce víc. Zejména ale teď dost vylepšil levnější modely. Mají totiž konečně slušný jednovláknový boost, který byl doteď slabinou. Celý článok „Přichází levnější ARM procesory s jádry „Nuvia“ pro notebooky“ »

  •  
  •  
  •  

AMD Ryzen 9 9900X v megateste 40 procesorov

Uzatvárame testy nových desktopových procesorov Ryzen 9000. To modelom, ktorý kedysi na mainstreamovej platforme AMD oproti svojmu predchodcovi či pilotnému modelu (Ryzen 9 3900X) navýšil počet jadier z ôsmich na dvanásť. Aj v porovnaní s Ryzen 9 5900X je nový procesor Ryzen 9 9900X v niektorých praktických situáciách rýchlejší aj viac ako dvojnásobne. Tento model je na tom najlepšie takisto čo sa týka efektivity. Celý článok „AMD Ryzen 9 9900X v megateste 40 procesorov“ »

  •  
  •  
  •  

AMD prozradilo Ryzen Z2 Extreme: Nový čip pro herní handheldy

Po vydání herního handhledu Steam Deck od Valve se takovéto mobilní konzole či herní PC staly dost populární. Hodně z nich používá procesory Ryzen Z1 a Z1 Extreme nebo jejich notebookové verze (Ryzen 7040 a 8040). Teď by se na trh ale měla dostat zařízení, které povýší na další level, chystá se totiž handheldová verze Ryzenů AI 300, tedy teď čerstvě nového APU Strix Point založeného už na Zenu 5 a grafice architektury RDNA 3.5. Celý článok „AMD prozradilo Ryzen Z2 Extreme: Nový čip pro herní handheldy“ »

  •  
  •  
  •  

Komentáre (34) Pridať komentár

  1. Mne se libi skutecnost ze AMD vpodstate vyvxji dve vetve procesoru. Jeden klasicky pro desktopy a servery kde zlepsuje stavajici a miri na zrychlovani stavajicich alikaci. Druha rada jsou AI cipy s vice druhy CPU jader a s pridanym AI blokem.

    To je velmi rozumny pristup. Citelny pro zakaznika. Take nehozi prekvapeni ze si poridite novy stroj za furu penez a ono vam to pobezi stejne. Nebo i pomaleji.

    Intel vsadil vse na jednu kartu. AI. Cpe veskere technologie do vsech segmentu trhu. Snad nezkrachuje.

    AI hype je ted na spici, uvidime za rok az prijde vystrizliveni. Napadne mi soucasna situce pripomina bublinu .com
    Pak to prasklo a vsici cumeli jak suvy z nudli.

    1. Že AI není až zase tak AI „artificial intelligence“ to víme. Dalo by se říct, že umělé to je, ale inteligence tam není žádná. Všechno to jsou jen algoritmy, které zdokonalují strojové učení. AI tak díky pokročilému výkonu počítačů umí mimořádně rychle vyhledávat a pokud najde podobný vzor, aplikuje ho na dotaz. Tím je to dané, bez trénovacích dat to neumí nic. Já jsem měl možnost se strojovým učením pracovat už před více než 20 lety (OCR) a od té doby to hodně pokročilo, ale v principu jde pořád o to samé. Žádné AI tam nehledej.

      Na druhou stranu do AI bubliny cpe peníze i EU a to nemálo. Proto si myslím, že za rok vystřízlivění nepřijde a pyramida se bude stavět dál, možná jednou skončí, ale nikdo nevíme kdy, klidně je možné, že to pojede dalších 10 let a pak to vymizí do ztracena. Kdo do toho včas naskočí, vydělá peníze, krach se konat nebude.

      Ohledně procesorů Zen 5, vypadá to skvěle, AMD fandím, aby prodeje byly vysoké, ale rovnou říkám, že pokud nebude někdo ode mě chtít postavit PC, tak se s ním asi nesetkám. V práci pořád Intel, na to vliv nemám a doma vůbec nevím, na co bych přidaný výkon od Zenu 3, který používám, využil.

      1. Bojím se spíše toho, že se podstata věci podcení. Říkám to kudy chodím. Všichni tlačí na efektivitu provádění prkotin, přitom málokdo se chce zabývat zefektivnění procesů řízení a přehlíží podstatné věci. Tam může přijít podobný skok a v podstatě vymazání drobného podnikatele. Spěje to k tomu, že bude člověk čověku vlkem ještě nesrovnatelně více.

        1. Fuj, takové svinstvo jako je drobný podnikatel samozřejmě EU vymaže, má na ně pifku. Buď máš být velká korporace, která si podnikání může dovolit nebo máš být její zaměstnanec, ale rozhodně si tedy EU nepřeje, aby lidi jen tak mýrnix týrnix drze podnikali! 😀

          1. Jak ohromné rezervy máme, dokládají snahy AI brzdit a regulovat. Ono to bez ohledu na podobné snahy nastane v důsledku tlaku trhu, např. vlivem nedostatku lidí s příslušnou kvalifikací. Tady o tom před časem třeba hezky psal Čermák. Bublinu tady tvoří salámismus, a až ta splaskne…

    2. Jo, pragmatismus v tom byl, ale vykládat jej lze i jinak. AI na desktopech a serverech většinou řeší přídavné GPU a akcelerátory, proto lze integraci NPU ještě dlouho odkládat. V noteboocích je větší tlak na efektivitu a zároveň menší pravděpodobnost, že AI bude moci akcelerovat jiná komponenta, proto tam NPU nasadili v předvoji.

      Ale jaký smysl už dnes třeba má plýtvat zdroji na cpu bez V-Cache?

  2. Veľká súťaž… …o nič
    Ja som mal AI pred cca 25 rokmi v krabičkovej kalkulačke od Casio.
    Bola niekde položená na intráku a potom som ju po cca 2 rokoch otvoril…skoro mi spadla na zem 😀
    Otázka: O akú AI sa jednalo?

    Pomôcka: links, zwei, drei, vier

    1. Žádný hype nevidím. Například mezi překladači a strojovým přepisem dnes a před pěti lety zeje propast. Bílé límečky mají orosená čela z dobrého důvodu.

      1. Neviem presne na čo reaguješ 😛 … Ja som len vyhlásil súťaž (ktorej výhra je „nič“)
        Ide o to, čo za AI som mal v krabičkovej kalkulačke (keď som krabičku po 2 rokoch otvoril)
        … celé to malo byť na odľahčenie 😀 …dal som aj jasnú pomôcku 😛
        (vcelku dôležité je aj to, že to bolo na intráku 🙂 )

          1. A víťazom sa stáva the patient… ešte nech sa páči sľúbená odmena = {}, …ale aj veľké významné +
            V tomto prípade AI = Ant intelligence
            Ma to vtedy dobre vyľakalo alebo skôr šokovalo… keď sa mi z kalkulačky vysypalo mravenisko
            Ale aj tak by som rád vedieť, čo tam počítali 😀 😀

              1. Keby radšej počítali ako sa zbaviť komentárov, kliešťov, ôs a pod., tak by som im tam sám ten cukor prisypával 😀
                Aj keď… Austrálčania by sa takejto pliage asi len smiali.

                Sa hovorí, že 9 z 10 najjedovatejších tvorov žije v Austrálii.
                Otázka: Ktorý je ten 10.? 😉
                (pozn. u mňa to tak neplatí) 🙂

                1. zeby niektore z tychto? Korovec (Heloderma), Outloň (Nycetibus), Rejsek krátkoocasý (Blarina brevicauda), Chřestýš diamantový (Crotalus adamanteus) a zevraj aj krtek obecny

                  1. ee… jedná sa o zviera najjedovatejšie s celosvetovým výskytom 😀
                    (pozn. musím podotknúť, že v mojom prípade to nie je pravda … no musím no) 😀
                    pomôcka: latinský názov je homo sapiens sapiens, ale nie tak hociktorý 😀

                    1. nj, zase správne… ako vravíš… je to tchýně reptající (lat. socrus murmurat) 😀

              1. No moja kalkulačka funguje čiste na anorganický pohon 😛
                Aj keď je pravda, že tá baterka funguje podozrivo dlho, možno som všetky mravce nevysypal, a nejaké ostali v baterke a makajú a makajú…ako som zlikvidoval veliteľský štáb, tak im nemá kto povedať, že už je „po vojne“. 😀
                (ako zabudnutým Japoncom na ostrovčekoch po skončení 2. sv. v.)

    2. Bude po nejakom čase, keď nikto neuhádne, aj odtajnenie odpovede? 🙂

      Relatívne nedávno som zháňal vzácnu HP-35, ale nezohnal a nakoniec musela byť dobrá aj HP 35s, to sú ale stále slabé prepdoklady na to byť úspešným riešiteľom, haha.

          1. 😀 😀 😀
            toto keď budem používať a nebodaj mi dotyčný porozumie, tak budem vedieť, že je čitateľ HWC 🙂

        1. Ktovie, aký to tak môže mať odber, tá kalukulačka… asi bude výrazne nižší ako u jednoduchších meracích prístrojov (s podobne monochromatickým segmentovým displejom), v ktorých batérie treba meniť každú chvíľu? 🙂

          1. kopa z nich dokazala bezat aj na malilinky predpotopny solarny panelicek takze asi dost miniaturny odber

            1. Úplná pravda… ale aj tak som očakával, že baterka to nemôže 30 rokov prežiť … no a žije a funguje
              … je pravda, že od mravcového incidentu som s ňou už nikdy nič nepočítal (nahradil ju excel, matlab… kalkulačku akosi nepotrebujem)
              … ale uvidíme možno bude ešte fungovať, keď dcérka pôjde do školy a bude potrebovať kalkulačku 🙂

              1. Verím, že sa ešte vráti do služby. Kalkulačka je zbavená všetkých tých lákadiel dnešnej doby, je bez sociálnych distraktorov. Len teda treba mať pred sebou tú kalkulačku. Mne príde skvelá na veci, pri ktorých nemusí bežať počítač, napríklad na počítanie spotreby ventilátorov dosadením premenných odčítaných z multimetrov, haha. Niekto môže namietať, že sa to už robí efektívnejšie, ale systém papier a pero má spoľahlivejší autosave. 🙂

              2. Takže máš dceru, no jo, já se umím trefit, když je zvláště třeba 😅
                Do takových lepších značek dávají baterky, které něco vydrží. Baterka v běžném číňanovi, co mám bokem, se odezvou poroučela už za dva roky. Ale má ta holka jiné přednosti, je robustní a věřím, že by přežila i ránu kladivem (výborný předpoklad také pro počítání daní).

                1. Tak mě napadá. Každá tchýně přece nakupuje pouze supervýhodně, mimo jiného i kalkulačky. Je to taková „masovka“, jak se říká, že jo. To budí soucit, no ne?

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *