Zen 5: Nejinovativnější jádro AMD od Zenu 1 [nově doplněný rozbor]

Frontend: Největší novinka jádra

Jsou to zhruba dva týdny do vydání procesorů AMD s novou architekturou Zen 5. Tento týden jsme se k těmto CPU dozvěděli konečně pořádné podrobnosti o jejich samotné architektuře, které AMD zveřejnilo na akci Tech Day. Už tedy můžeme rozebrat změny, které firma udělala v jádru oproti Zenu 4 – a že jsou hodně rozsáhlé, asi více, než se v červnu zdálo. A firma také zopakovala příslib 16% zvýšení IPC u těchto procesorů.

Frontend: Největší novinka jádra

Dopředu se o Zenu 5 vědělo to, že přinese výrazné posílení SIMD jednotek na dvojnásobnou 512bitovou šířku a také rozšíří jádro (jak už bylo zmíněno). Nakonec však jsou stejně velké změny ve frontendu, který se stará o to, aby samotné vykonávací jednotky měly co na práci, jádro je tedy výrazně upgradováno prakticky všude.

Nejzásadnější změna ve frontendu je, že jádro má zdvojené bloky provádějící fetch a dekódování instrukcí, a to ne ve smyslu prostého zdvojnásobení propustnosti, ale to, že jádro má tyto části dvakrát. Instrukční L1 cache podporuje načítání instrukcí programu ze dvou míst současně (fetch je 2× 32 bajtů za cyklus), tedy dvou proudů instrukcí. Stejně tak je současně možné brát instrukce ze dvou míst také z uOP cache, která ukládá již dekódované instrukce.

Ty jsou konzumovány dvěma klastry dekodérů. Zatímco předchozí čtyři generace jader Zen mají všechny čtyři dekodéry (tedy schopnost dekódovat čtyři instrukce za cyklus), Zen 5 má dva klastry těchto čtyř dekodérů, každý schopný zpracovávat jeden z oněch dvou proudů instrukcí.

Prezentace architektury Zen 5, Granite Ridge a Strix Point (Autor: AMD, via: ComputerBase)

Tato konfigurace se může chovat jedním ze dvou způsobů. Jádro Zen 5 nadále poskytuje SMT, může tedy zpracovávat dvě vlákna najednou. V takové situaci dostane každé vlákno jeden dekodér, a má tedy tolik dekódovacích prostředků, kolik měla předchozí jádra celkově. Mike Clark z AMD ale potvrdil, že oba dva klastry dekodérů může jádro použít i jen při běhu jediného vlákna (také řekl, že u jader Zen jsou typicky všechny prostředky jádra vždy k dispozici i jen jedinému běžícímu vláknu).

Asi to však má svá omezení a jádro není schopné oba klastry zapojit tak často jako jádra E-Core od Intelu jako Gracemont a Skymont, kde je podobná technologie také použitá. Pravděpodobně je to tak, že druhý klastr dekodérů se může zapojit tehdy, pokud v programu dochází k větvení a je detekován skok programu na jinou adresu (tedy větvení, pro které predikce říká, že skutečně bude provedeno). Druhý klastr dekodérů tak nemusí čekat, až dekodéry prvního klastru dokončí práci, protože zná místo, kde může začít dekódovat, jelikož na něm určitě začíná nová instrukce.

Občas se uvádí, že v kódu x86 programů bývá až jedno větvení na šest instrukcí, což by dovolovalo využívat oba klastry relativně často, a může to tedy o trošku zvyšovat celkové IPC. Ovšem asi to má ten efekt, že jádru Zen 5 vyhovuje takové kompilování kódu, aby častěji využívanou cestou bylo provedení skoku oproti neprovedení. Toto je něco, co může vyžadovat profilování a rekompilování softwaru, protože ve starších architekturách je většinou výhodnější, když větvení většinou provedená nejsou, protože dříve jádra zvládala méně provedených než neprovedených větvení.

Nicméně schopnost současného použití těchto dvou klastrů dekodérů bude pravděpodobně dále rozvíjena v budoucnosti, takže eventuálně asi jejich přínos pro IPC poroste. Jde o jednu z těch věcí, kde Zen 5 staví infrastrukturu pro Zen 6, 7 a tak dále.

Prezentace architektury Zen 5, Granite Ridge a Strix Point (Autor: AMD, via: ComputerBase)

Jádro Zen 5 má vylepšenou predikci větvení pro větší úspěšnost předpovědí (což je něco, kde se dělávají zlepšení v každé generaci). Predikce má nejen mít nižší latence, ale také větší propustnost – tedy schopnost zpracovávat více větvení za cyklus.

2-ahead prediktor větvení

Prediktor větvení používá design nové generace založený na tzv. 2-ahead koncepci. Dokáže zpracovávat podmíněné skoky bez prodlevy a umí zpracovat dvě provedená větvení (taken branches) za cyklus, což je velký upgrade. Jádro díky této schopnosti dokáže při predikci dvou provedených skoků během jednoho cyklu pracovat až s třemi predikčními okny kódu. L1 BTB (Branch Target Buffer) byl rozšířen z 1,5K na masivních 16K entries, a TAGE je také větší. Jádro také dostalo větší return address stack o 52 položkách, pro lepší výkon při návratech z volaných funkcí.

Po fázi dekódování následují fáze rename a dispatch, které byly také rozšířené a místo šesti instrukcí (operací) za cyklus mají zvládat osm operací za cyklus, jde tedy o další část onoho celkového rozšíření jádra. 8 operací za cyklus zvládá i úplně finální fáze retire, AMD jí tedy nedává vyšší kapacitu, než má dispatch, jako to dělá Intel. Šířku dispatche a rename (přejmenování registrů) ale mají jádra AMD i Intelu stejnou.

uOP cache je zmenšená, ale vejde se toho do ní víc?

Dispatch může kromě oněch dvou klastrů dekodérů krmit také uOP cache. Ta by snad měla mít kapacitu 6000 položek, což je o polovinu více než u Zenu 2 a 3, ale o něco méně než u Zenu 4 (ten měl zřejmě 6750 položek). Z této uOp cache může proudit dál špičkově až 12 či 2× 6 (už dekódovaných) instrukcí za cyklus.

Ačkoliv uOP cache byla zmenšena, ve skutečnosti to nemusí znamenat regresi. Je tu totiž jedna důležitá změna. V předchozích generacích každá uOP zabíral jednu položku, kdežto v Zenu 5 je v jedné položce uložen ekvivalent jedné instrukce, která se skládá ze zfúzovaných uOPů. Ty jsou pak rozděleny až později při vykonávání. Tento způsob šetří kapacitu uOP cache a zřejmě také fáze dispatch. Toto dost možná je schopné vykompenzovat zmenšení nominální kapacity uOP cache.

U uOP cache byla také zvýšená asociativita z 12cestné na 16cestnou.

Stále konzervativní hloubka Reorder Bufferu

AMD zvětšilo Reorder Buffer (RoB), tedy hlavní frontu, v které probíhá princip Out-of-Order vykonávání instrukcí a které tvoří „okno instrukcí“, v jehož rámci procesor může optimalizovat vykonání faktickým přeházením pořadí instrukcí. AMD mělo RoB vždy poměrně malý v porovnání s Intelem, nemluvě o srovnání s jádry Apple. Zen 3 měl RoB o 256 položkách jako Skylake nebo E-Core Gracemont od Intelu, Zen 4 ho zvětšil na 320 položek, zatímco Intel Golden Cove už mělo 512. U Zenu 5 dojde k lehce odvážnějšímu zvětšení na 448 položek (+40 %), ale AMD je zde pořád konzervativnější než všichni jeho konkurenti (Apple, Intel i ARM).

Zen 5 je nyní někde mezi hloubkou RoB u jader Sunny Cove/Ice Lake (352) a Golden Cove od Intelu, ale evidentně s touto nižší hloubkou dokáže vyvinout jádro s výrazně větším výkonem na 1 MHz, než na ní založil Intel. Asi to ale zapadá do filozofie „rovnováhy“ mezi výkonem a efektivitou, která byla pro Zen na začátku uváděna jako vodítko.

Kolik stupňů má pipeline Zenu 5?

AMD přímo neprozrazuje, kolikastupňová je pipeline procesoru, což ale nebylo uváděno ani u předchozích jader linie Zen. Toto tedy bude nutné zjistit nepřímo pomocí mikrobenchmarků.

Pravděpodobně ale došlo k prodloužení pipeline o jeden stupeň, který byl někde přidán, protože AMD řeklo, že postih za špatně odhadnuté větvení, který je nepřímo indikátorem počtu stupňů v pipeline, by kvůli změnám v jádru měl obvykle být o jeden cyklus větší.

Článek pokračuje na další straně.


  •  
  •  
  •  
Flattr this!

Intel Battlemage je tady, Arc B580 a B570 vyjdou příští týden

Před několika dny prozradily obchody připravovanou grafiku Intel Arc B580 nové generace „Battlemage“, která by dle předchozích drbů měla jít do prodeje v prosinci. A už to zřejmě máme potvrzené, prosákly informace o datu vydání a také o tom, že Battlemage nebude jenom jedna. Intel chystá dvě či tři karty. Nebo alespoň prozatím, protože později se ještě mohou přidat výkonnější modely, jejichž osud teď není moc jasný. Celý článok „Intel Battlemage je tady, Arc B580 a B570 vyjdou příští týden“ »

  •  
  •  
  •  

Už máme specifikace GeForce RTX 5070 a GeForce RTX 5070 Ti

Až v novém roce sice dojde k vydání nové generace grafik od Nvidie, přesto už ale začaly prosakovat podrobnosti o chystaných modelech, které v prvních měsících roku 2025 vyjdou. Během týdne se sešly novinky k GeForce RTX 5090 coby nejvýkonnějšímu modelu, ale zejména i k levnějším GeForce RTX 5070 Ti a GeForce RTX 5070, což mohou být zrovna karty, které budou vzhledem k cenám „highendu“ zajímat nejvíc hráčů. Celý článok „Už máme specifikace GeForce RTX 5070 a GeForce RTX 5070 Ti“ »

  •  
  •  
  •  

AMD Ryzen 7 9800X3D: „Herná“ špička s MT a ST boostom

Vysoký herný výkon je niečo, čo sa od procesora AMD Ryzen 7 9800X3D, tak nejako očakáva. Oproti svojmu predchodcovi (Ryzen 7 7800X3D) sa však výrazne zlepšili možnosti chladenia, čo otvára cestu k vyšším frekvenciám. Ryzen 7 9800X3D sa tak posunul najmä po stránke viacvláknového, ale aj jednovláknového výkonu. Tento procesor s 3D V-Cache je tak univerzálnejší – lepšie uchopiteľný pre viacero scenárov použitia. Celý článok „AMD Ryzen 7 9800X3D: „Herná“ špička s MT a ST boostom“ »

  •  
  •  
  •  

Komentáre (34) Pridať komentár

  1. Mne se libi skutecnost ze AMD vpodstate vyvxji dve vetve procesoru. Jeden klasicky pro desktopy a servery kde zlepsuje stavajici a miri na zrychlovani stavajicich alikaci. Druha rada jsou AI cipy s vice druhy CPU jader a s pridanym AI blokem.

    To je velmi rozumny pristup. Citelny pro zakaznika. Take nehozi prekvapeni ze si poridite novy stroj za furu penez a ono vam to pobezi stejne. Nebo i pomaleji.

    Intel vsadil vse na jednu kartu. AI. Cpe veskere technologie do vsech segmentu trhu. Snad nezkrachuje.

    AI hype je ted na spici, uvidime za rok az prijde vystrizliveni. Napadne mi soucasna situce pripomina bublinu .com
    Pak to prasklo a vsici cumeli jak suvy z nudli.

    1. Že AI není až zase tak AI „artificial intelligence“ to víme. Dalo by se říct, že umělé to je, ale inteligence tam není žádná. Všechno to jsou jen algoritmy, které zdokonalují strojové učení. AI tak díky pokročilému výkonu počítačů umí mimořádně rychle vyhledávat a pokud najde podobný vzor, aplikuje ho na dotaz. Tím je to dané, bez trénovacích dat to neumí nic. Já jsem měl možnost se strojovým učením pracovat už před více než 20 lety (OCR) a od té doby to hodně pokročilo, ale v principu jde pořád o to samé. Žádné AI tam nehledej.

      Na druhou stranu do AI bubliny cpe peníze i EU a to nemálo. Proto si myslím, že za rok vystřízlivění nepřijde a pyramida se bude stavět dál, možná jednou skončí, ale nikdo nevíme kdy, klidně je možné, že to pojede dalších 10 let a pak to vymizí do ztracena. Kdo do toho včas naskočí, vydělá peníze, krach se konat nebude.

      Ohledně procesorů Zen 5, vypadá to skvěle, AMD fandím, aby prodeje byly vysoké, ale rovnou říkám, že pokud nebude někdo ode mě chtít postavit PC, tak se s ním asi nesetkám. V práci pořád Intel, na to vliv nemám a doma vůbec nevím, na co bych přidaný výkon od Zenu 3, který používám, využil.

      1. Bojím se spíše toho, že se podstata věci podcení. Říkám to kudy chodím. Všichni tlačí na efektivitu provádění prkotin, přitom málokdo se chce zabývat zefektivnění procesů řízení a přehlíží podstatné věci. Tam může přijít podobný skok a v podstatě vymazání drobného podnikatele. Spěje to k tomu, že bude člověk čověku vlkem ještě nesrovnatelně více.

        1. Fuj, takové svinstvo jako je drobný podnikatel samozřejmě EU vymaže, má na ně pifku. Buď máš být velká korporace, která si podnikání může dovolit nebo máš být její zaměstnanec, ale rozhodně si tedy EU nepřeje, aby lidi jen tak mýrnix týrnix drze podnikali! 😀

          1. Jak ohromné rezervy máme, dokládají snahy AI brzdit a regulovat. Ono to bez ohledu na podobné snahy nastane v důsledku tlaku trhu, např. vlivem nedostatku lidí s příslušnou kvalifikací. Tady o tom před časem třeba hezky psal Čermák. Bublinu tady tvoří salámismus, a až ta splaskne…

    2. Jo, pragmatismus v tom byl, ale vykládat jej lze i jinak. AI na desktopech a serverech většinou řeší přídavné GPU a akcelerátory, proto lze integraci NPU ještě dlouho odkládat. V noteboocích je větší tlak na efektivitu a zároveň menší pravděpodobnost, že AI bude moci akcelerovat jiná komponenta, proto tam NPU nasadili v předvoji.

      Ale jaký smysl už dnes třeba má plýtvat zdroji na cpu bez V-Cache?

  2. Veľká súťaž… …o nič
    Ja som mal AI pred cca 25 rokmi v krabičkovej kalkulačke od Casio.
    Bola niekde položená na intráku a potom som ju po cca 2 rokoch otvoril…skoro mi spadla na zem 😀
    Otázka: O akú AI sa jednalo?

    Pomôcka: links, zwei, drei, vier

    1. Žádný hype nevidím. Například mezi překladači a strojovým přepisem dnes a před pěti lety zeje propast. Bílé límečky mají orosená čela z dobrého důvodu.

      1. Neviem presne na čo reaguješ 😛 … Ja som len vyhlásil súťaž (ktorej výhra je „nič“)
        Ide o to, čo za AI som mal v krabičkovej kalkulačke (keď som krabičku po 2 rokoch otvoril)
        … celé to malo byť na odľahčenie 😀 …dal som aj jasnú pomôcku 😛
        (vcelku dôležité je aj to, že to bolo na intráku 🙂 )

          1. A víťazom sa stáva the patient… ešte nech sa páči sľúbená odmena = {}, …ale aj veľké významné +
            V tomto prípade AI = Ant intelligence
            Ma to vtedy dobre vyľakalo alebo skôr šokovalo… keď sa mi z kalkulačky vysypalo mravenisko
            Ale aj tak by som rád vedieť, čo tam počítali 😀 😀

              1. Keby radšej počítali ako sa zbaviť komentárov, kliešťov, ôs a pod., tak by som im tam sám ten cukor prisypával 😀
                Aj keď… Austrálčania by sa takejto pliage asi len smiali.

                Sa hovorí, že 9 z 10 najjedovatejších tvorov žije v Austrálii.
                Otázka: Ktorý je ten 10.? 😉
                (pozn. u mňa to tak neplatí) 🙂

                1. zeby niektore z tychto? Korovec (Heloderma), Outloň (Nycetibus), Rejsek krátkoocasý (Blarina brevicauda), Chřestýš diamantový (Crotalus adamanteus) a zevraj aj krtek obecny

                  1. ee… jedná sa o zviera najjedovatejšie s celosvetovým výskytom 😀
                    (pozn. musím podotknúť, že v mojom prípade to nie je pravda … no musím no) 😀
                    pomôcka: latinský názov je homo sapiens sapiens, ale nie tak hociktorý 😀

                    1. nj, zase správne… ako vravíš… je to tchýně reptající (lat. socrus murmurat) 😀

              1. No moja kalkulačka funguje čiste na anorganický pohon 😛
                Aj keď je pravda, že tá baterka funguje podozrivo dlho, možno som všetky mravce nevysypal, a nejaké ostali v baterke a makajú a makajú…ako som zlikvidoval veliteľský štáb, tak im nemá kto povedať, že už je „po vojne“. 😀
                (ako zabudnutým Japoncom na ostrovčekoch po skončení 2. sv. v.)

    2. Bude po nejakom čase, keď nikto neuhádne, aj odtajnenie odpovede? 🙂

      Relatívne nedávno som zháňal vzácnu HP-35, ale nezohnal a nakoniec musela byť dobrá aj HP 35s, to sú ale stále slabé prepdoklady na to byť úspešným riešiteľom, haha.

          1. 😀 😀 😀
            toto keď budem používať a nebodaj mi dotyčný porozumie, tak budem vedieť, že je čitateľ HWC 🙂

        1. Ktovie, aký to tak môže mať odber, tá kalukulačka… asi bude výrazne nižší ako u jednoduchších meracích prístrojov (s podobne monochromatickým segmentovým displejom), v ktorých batérie treba meniť každú chvíľu? 🙂

          1. kopa z nich dokazala bezat aj na malilinky predpotopny solarny panelicek takze asi dost miniaturny odber

            1. Úplná pravda… ale aj tak som očakával, že baterka to nemôže 30 rokov prežiť … no a žije a funguje
              … je pravda, že od mravcového incidentu som s ňou už nikdy nič nepočítal (nahradil ju excel, matlab… kalkulačku akosi nepotrebujem)
              … ale uvidíme možno bude ešte fungovať, keď dcérka pôjde do školy a bude potrebovať kalkulačku 🙂

              1. Verím, že sa ešte vráti do služby. Kalkulačka je zbavená všetkých tých lákadiel dnešnej doby, je bez sociálnych distraktorov. Len teda treba mať pred sebou tú kalkulačku. Mne príde skvelá na veci, pri ktorých nemusí bežať počítač, napríklad na počítanie spotreby ventilátorov dosadením premenných odčítaných z multimetrov, haha. Niekto môže namietať, že sa to už robí efektívnejšie, ale systém papier a pero má spoľahlivejší autosave. 🙂

              2. Takže máš dceru, no jo, já se umím trefit, když je zvláště třeba 😅
                Do takových lepších značek dávají baterky, které něco vydrží. Baterka v běžném číňanovi, co mám bokem, se odezvou poroučela už za dva roky. Ale má ta holka jiné přednosti, je robustní a věřím, že by přežila i ránu kladivem (výborný předpoklad také pro počítání daní).

                1. Tak mě napadá. Každá tchýně přece nakupuje pouze supervýhodně, mimo jiného i kalkulačky. Je to taková „masovka“, jak se říká, že jo. To budí soucit, no ne?

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *