Frontend: Největší novinka jádra
Jsou to zhruba dva týdny do vydání procesorů AMD s novou architekturou Zen 5. Tento týden jsme se k těmto CPU dozvěděli konečně pořádné podrobnosti o jejich samotné architektuře, které AMD zveřejnilo na akci Tech Day. Už tedy můžeme rozebrat změny, které firma udělala v jádru oproti Zenu 4 – a že jsou hodně rozsáhlé, asi více, než se v červnu zdálo. A firma také zopakovala příslib 16% zvýšení IPC u těchto procesorů.
Frontend: Největší novinka jádra
Dopředu se o Zenu 5 vědělo to, že přinese výrazné posílení SIMD jednotek na dvojnásobnou 512bitovou šířku a také rozšíří jádro (jak už bylo zmíněno). Nakonec však jsou stejně velké změny ve frontendu, který se stará o to, aby samotné vykonávací jednotky měly co na práci, jádro je tedy výrazně upgradováno prakticky všude.
Nejzásadnější změna ve frontendu je, že jádro má zdvojené bloky provádějící fetch a dekódování instrukcí, a to ne ve smyslu prostého zdvojnásobení propustnosti, ale to, že jádro má tyto části dvakrát. Instrukční L1 cache podporuje načítání instrukcí programu ze dvou míst současně (fetch je 2× 32 bajtů za cyklus), tedy dvou proudů instrukcí. Stejně tak je současně možné brát instrukce ze dvou míst také z uOP cache, která ukládá již dekódované instrukce.
Ty jsou konzumovány dvěma klastry dekodérů. Zatímco předchozí čtyři generace jader Zen mají všechny čtyři dekodéry (tedy schopnost dekódovat čtyři instrukce za cyklus), Zen 5 má dva klastry těchto čtyř dekodérů, každý schopný zpracovávat jeden z oněch dvou proudů instrukcí.
Tato konfigurace se může chovat jedním ze dvou způsobů. Jádro Zen 5 nadále poskytuje SMT, může tedy zpracovávat dvě vlákna najednou. V takové situaci dostane každé vlákno jeden dekodér, a má tedy tolik dekódovacích prostředků, kolik měla předchozí jádra celkově. Mike Clark z AMD ale potvrdil, že oba dva klastry dekodérů může jádro použít i jen při běhu jediného vlákna (také řekl, že u jader Zen jsou typicky všechny prostředky jádra vždy k dispozici i jen jedinému běžícímu vláknu).
Asi to však má svá omezení a jádro není schopné oba klastry zapojit tak často jako jádra E-Core od Intelu jako Gracemont a Skymont, kde je podobná technologie také použitá. Pravděpodobně je to tak, že druhý klastr dekodérů se může zapojit tehdy, pokud v programu dochází k větvení a je detekován skok programu na jinou adresu (tedy větvení, pro které predikce říká, že skutečně bude provedeno). Druhý klastr dekodérů tak nemusí čekat, až dekodéry prvního klastru dokončí práci, protože zná místo, kde může začít dekódovat, jelikož na něm určitě začíná nová instrukce.
Občas se uvádí, že v kódu x86 programů bývá až jedno větvení na šest instrukcí, což by dovolovalo využívat oba klastry relativně často, a může to tedy o trošku zvyšovat celkové IPC. Ovšem asi to má ten efekt, že jádru Zen 5 vyhovuje takové kompilování kódu, aby častěji využívanou cestou bylo provedení skoku oproti neprovedení. Toto je něco, co může vyžadovat profilování a rekompilování softwaru, protože ve starších architekturách je většinou výhodnější, když větvení většinou provedená nejsou, protože dříve jádra zvládala méně provedených než neprovedených větvení.
Nicméně schopnost současného použití těchto dvou klastrů dekodérů bude pravděpodobně dále rozvíjena v budoucnosti, takže eventuálně asi jejich přínos pro IPC poroste. Jde o jednu z těch věcí, kde Zen 5 staví infrastrukturu pro Zen 6, 7 a tak dále.
Jádro Zen 5 má vylepšenou predikci větvení pro větší úspěšnost předpovědí (což je něco, kde se dělávají zlepšení v každé generaci). Predikce má nejen mít nižší latence, ale také větší propustnost – tedy schopnost zpracovávat více větvení za cyklus.
2-ahead prediktor větvení
Prediktor větvení používá design nové generace založený na tzv. 2-ahead koncepci. Dokáže zpracovávat podmíněné skoky bez prodlevy a umí zpracovat dvě provedená větvení (taken branches) za cyklus, což je velký upgrade. Jádro díky této schopnosti dokáže při predikci dvou provedených skoků během jednoho cyklu pracovat až s třemi predikčními okny kódu. L1 BTB (Branch Target Buffer) byl rozšířen z 1,5K na masivních 16K entries, a TAGE je také větší. Jádro také dostalo větší return address stack o 52 položkách, pro lepší výkon při návratech z volaných funkcí.
Po fázi dekódování následují fáze rename a dispatch, které byly také rozšířené a místo šesti instrukcí (operací) za cyklus mají zvládat osm operací za cyklus, jde tedy o další část onoho celkového rozšíření jádra. 8 operací za cyklus zvládá i úplně finální fáze retire, AMD jí tedy nedává vyšší kapacitu, než má dispatch, jako to dělá Intel. Šířku dispatche a rename (přejmenování registrů) ale mají jádra AMD i Intelu stejnou.
uOP cache je zmenšená, ale vejde se toho do ní víc?
Dispatch může kromě oněch dvou klastrů dekodérů krmit také uOP cache. Ta by snad měla mít kapacitu 6000 položek, což je o polovinu více než u Zenu 2 a 3, ale o něco méně než u Zenu 4 (ten měl zřejmě 6750 položek). Z této uOp cache může proudit dál špičkově až 12 či 2× 6 (už dekódovaných) instrukcí za cyklus.
Ačkoliv uOP cache byla zmenšena, ve skutečnosti to nemusí znamenat regresi. Je tu totiž jedna důležitá změna. V předchozích generacích každá uOP zabíral jednu položku, kdežto v Zenu 5 je v jedné položce uložen ekvivalent jedné instrukce, která se skládá ze zfúzovaných uOPů. Ty jsou pak rozděleny až později při vykonávání. Tento způsob šetří kapacitu uOP cache a zřejmě také fáze dispatch. Toto dost možná je schopné vykompenzovat zmenšení nominální kapacity uOP cache.
U uOP cache byla také zvýšená asociativita z 12cestné na 16cestnou.
Stále konzervativní hloubka Reorder Bufferu
AMD zvětšilo Reorder Buffer (RoB), tedy hlavní frontu, v které probíhá princip Out-of-Order vykonávání instrukcí a které tvoří „okno instrukcí“, v jehož rámci procesor může optimalizovat vykonání faktickým přeházením pořadí instrukcí. AMD mělo RoB vždy poměrně malý v porovnání s Intelem, nemluvě o srovnání s jádry Apple. Zen 3 měl RoB o 256 položkách jako Skylake nebo E-Core Gracemont od Intelu, Zen 4 ho zvětšil na 320 položek, zatímco Intel Golden Cove už mělo 512. U Zenu 5 dojde k lehce odvážnějšímu zvětšení na 448 položek (+40 %), ale AMD je zde pořád konzervativnější než všichni jeho konkurenti (Apple, Intel i ARM).
Zen 5 je nyní někde mezi hloubkou RoB u jader Sunny Cove/Ice Lake (352) a Golden Cove od Intelu, ale evidentně s touto nižší hloubkou dokáže vyvinout jádro s výrazně větším výkonem na 1 MHz, než na ní založil Intel. Asi to ale zapadá do filozofie „rovnováhy“ mezi výkonem a efektivitou, která byla pro Zen na začátku uváděna jako vodítko.
Kolik stupňů má pipeline Zenu 5?
AMD přímo neprozrazuje, kolikastupňová je pipeline procesoru, což ale nebylo uváděno ani u předchozích jader linie Zen. Toto tedy bude nutné zjistit nepřímo pomocí mikrobenchmarků.
Pravděpodobně ale došlo k prodloužení pipeline o jeden stupeň, který byl někde přidán, protože AMD řeklo, že postih za špatně odhadnuté větvení, který je nepřímo indikátorem počtu stupňů v pipeline, by kvůli změnám v jádru měl obvykle být o jeden cyklus větší.
Článek pokračuje na další straně.
⠀
⠀
- Contents
- Úvod: Desktopový Zen 5 se vejde do stejné plochy jako Zen 4
- Frontend: Největší novinka jádra
- Upgrade vykonávacích jednotek I: 6× ALU
- Upgrade vykonávacích jednotek II: AVX-512 naplno
- Výkonnější a konečně větší L1 cache, SMT
- Největší architektonický počin od samotného přechodu na architekturu Zen (Závěr)
Mne se libi skutecnost ze AMD vpodstate vyvxji dve vetve procesoru. Jeden klasicky pro desktopy a servery kde zlepsuje stavajici a miri na zrychlovani stavajicich alikaci. Druha rada jsou AI cipy s vice druhy CPU jader a s pridanym AI blokem.
To je velmi rozumny pristup. Citelny pro zakaznika. Take nehozi prekvapeni ze si poridite novy stroj za furu penez a ono vam to pobezi stejne. Nebo i pomaleji.
Intel vsadil vse na jednu kartu. AI. Cpe veskere technologie do vsech segmentu trhu. Snad nezkrachuje.
AI hype je ted na spici, uvidime za rok az prijde vystrizliveni. Napadne mi soucasna situce pripomina bublinu .com
Pak to prasklo a vsici cumeli jak suvy z nudli.
Že AI není až zase tak AI „artificial intelligence“ to víme. Dalo by se říct, že umělé to je, ale inteligence tam není žádná. Všechno to jsou jen algoritmy, které zdokonalují strojové učení. AI tak díky pokročilému výkonu počítačů umí mimořádně rychle vyhledávat a pokud najde podobný vzor, aplikuje ho na dotaz. Tím je to dané, bez trénovacích dat to neumí nic. Já jsem měl možnost se strojovým učením pracovat už před více než 20 lety (OCR) a od té doby to hodně pokročilo, ale v principu jde pořád o to samé. Žádné AI tam nehledej.
Na druhou stranu do AI bubliny cpe peníze i EU a to nemálo. Proto si myslím, že za rok vystřízlivění nepřijde a pyramida se bude stavět dál, možná jednou skončí, ale nikdo nevíme kdy, klidně je možné, že to pojede dalších 10 let a pak to vymizí do ztracena. Kdo do toho včas naskočí, vydělá peníze, krach se konat nebude.
Ohledně procesorů Zen 5, vypadá to skvěle, AMD fandím, aby prodeje byly vysoké, ale rovnou říkám, že pokud nebude někdo ode mě chtít postavit PC, tak se s ním asi nesetkám. V práci pořád Intel, na to vliv nemám a doma vůbec nevím, na co bych přidaný výkon od Zenu 3, který používám, využil.
Bojím se spíše toho, že se podstata věci podcení. Říkám to kudy chodím. Všichni tlačí na efektivitu provádění prkotin, přitom málokdo se chce zabývat zefektivnění procesů řízení a přehlíží podstatné věci. Tam může přijít podobný skok a v podstatě vymazání drobného podnikatele. Spěje to k tomu, že bude člověk čověku vlkem ještě nesrovnatelně více.
Fuj, takové svinstvo jako je drobný podnikatel samozřejmě EU vymaže, má na ně pifku. Buď máš být velká korporace, která si podnikání může dovolit nebo máš být její zaměstnanec, ale rozhodně si tedy EU nepřeje, aby lidi jen tak mýrnix týrnix drze podnikali! 😀
Jak ohromné rezervy máme, dokládají snahy AI brzdit a regulovat. Ono to bez ohledu na podobné snahy nastane v důsledku tlaku trhu, např. vlivem nedostatku lidí s příslušnou kvalifikací. Tady o tom před časem třeba hezky psal Čermák. Bublinu tady tvoří salámismus, a až ta splaskne…
Jo, pragmatismus v tom byl, ale vykládat jej lze i jinak. AI na desktopech a serverech většinou řeší přídavné GPU a akcelerátory, proto lze integraci NPU ještě dlouho odkládat. V noteboocích je větší tlak na efektivitu a zároveň menší pravděpodobnost, že AI bude moci akcelerovat jiná komponenta, proto tam NPU nasadili v předvoji.
Ale jaký smysl už dnes třeba má plýtvat zdroji na cpu bez V-Cache?
Veľká súťaž… …o nič
Ja som mal AI pred cca 25 rokmi v krabičkovej kalkulačke od Casio.
Bola niekde položená na intráku a potom som ju po cca 2 rokoch otvoril…skoro mi spadla na zem 😀
Otázka: O akú AI sa jednalo?
…
Pomôcka: links, zwei, drei, vier
Žádný hype nevidím. Například mezi překladači a strojovým přepisem dnes a před pěti lety zeje propast. Bílé límečky mají orosená čela z dobrého důvodu.
Neviem presne na čo reaguješ 😛 … Ja som len vyhlásil súťaž (ktorej výhra je „nič“)
Ide o to, čo za AI som mal v krabičkovej kalkulačke (keď som krabičku po 2 rokoch otvoril)
… celé to malo byť na odľahčenie 😀 …dal som aj jasnú pomôcku 😛
(vcelku dôležité je aj to, že to bolo na intráku 🙂 )
Proč nic? Úspěšnému řešiteli sezónní odměna na kostku cukru napochoduje sama, stačí setřít, nasušit a jemně osolit. Na intráku přijde teprve k chuti!
A víťazom sa stáva the patient… ešte nech sa páči sľúbená odmena = {}, …ale aj veľké významné +
V tomto prípade AI = Ant intelligence
Ma to vtedy dobre vyľakalo alebo skôr šokovalo… keď sa mi z kalkulačky vysypalo mravenisko
Ale aj tak by som rád vedieť, čo tam počítali 😀 😀
To je přeci jasné, jak vyhladit rudé.
Keby radšej počítali ako sa zbaviť komentárov, kliešťov, ôs a pod., tak by som im tam sám ten cukor prisypával 😀
Aj keď… Austrálčania by sa takejto pliage asi len smiali.
…
Sa hovorí, že 9 z 10 najjedovatejších tvorov žije v Austrálii.
Otázka: Ktorý je ten 10.? 😉
(pozn. u mňa to tak neplatí) 🙂
Zasa…. Android spravil z komárov komentáre 😀 aspoň, že je tentokrát vtipný
Velbloudi si můžou pro jednou oddechnout 🙂
inak my (SK) máme v tomto porekadle somára namiesto ťavy 🙂
zeby niektore z tychto? Korovec (Heloderma), Outloň (Nycetibus), Rejsek krátkoocasý (Blarina brevicauda), Chřestýš diamantový (Crotalus adamanteus) a zevraj aj krtek obecny
ee… jedná sa o zviera najjedovatejšie s celosvetovým výskytom 😀
(pozn. musím podotknúť, že v mojom prípade to nie je pravda … no musím no) 😀
pomôcka: latinský názov je homo sapiens sapiens, ale nie tak hociktorý 😀
Tak nejspíš Svokra Priestoreká, že jo.
nj, zase správne… ako vravíš… je to tchýně reptající (lat. socrus murmurat) 😀
Co blbnete, mravenci tam mají být, bez nich to nefunguje. https://youtu.be/42Nz8Dw2_yU?feature=shared&t=6717
Akorát jestli se vysypali ven, tak nevím, jestli nebude třeba doplnit v servisu.
No moja kalkulačka funguje čiste na anorganický pohon 😛
Aj keď je pravda, že tá baterka funguje podozrivo dlho, možno som všetky mravce nevysypal, a nejaké ostali v baterke a makajú a makajú…ako som zlikvidoval veliteľský štáb, tak im nemá kto povedať, že už je „po vojne“. 😀
(ako zabudnutým Japoncom na ostrovčekoch po skončení 2. sv. v.)
Bude po nejakom čase, keď nikto neuhádne, aj odtajnenie odpovede? 🙂
Relatívne nedávno som zháňal vzácnu HP-35, ale nezohnal a nakoniec musela byť dobrá aj HP 35s, to sú ale stále slabé prepdoklady na to byť úspešným riešiteľom, haha.
Á-ha, tak nakoniec the patient možno nebude až taký „suchár“, ako písal. Respektíve, budem to mať horšie. 🙂
Jak se říká, nedělej z komára komentář 🙂
😀 😀 😀
toto keď budem používať a nebodaj mi dotyčný porozumie, tak budem vedieť, že je čitateľ HWC 🙂
Ha, našiel som ju, otvoril (teraz žiadne mravce), zapol … a ide.
Pôvodná baterka, kalkulačka z 2. polovice 90 rokov minulého storočia … to by sa teraz nemohlo stať
https://imgur.com/8Jt3SGE
Ktovie, aký to tak môže mať odber, tá kalukulačka… asi bude výrazne nižší ako u jednoduchších meracích prístrojov (s podobne monochromatickým segmentovým displejom), v ktorých batérie treba meniť každú chvíľu? 🙂
kopa z nich dokazala bezat aj na malilinky predpotopny solarny panelicek takze asi dost miniaturny odber
Úplná pravda… ale aj tak som očakával, že baterka to nemôže 30 rokov prežiť … no a žije a funguje
… je pravda, že od mravcového incidentu som s ňou už nikdy nič nepočítal (nahradil ju excel, matlab… kalkulačku akosi nepotrebujem)
… ale uvidíme možno bude ešte fungovať, keď dcérka pôjde do školy a bude potrebovať kalkulačku 🙂
Verím, že sa ešte vráti do služby. Kalkulačka je zbavená všetkých tých lákadiel dnešnej doby, je bez sociálnych distraktorov. Len teda treba mať pred sebou tú kalkulačku. Mne príde skvelá na veci, pri ktorých nemusí bežať počítač, napríklad na počítanie spotreby ventilátorov dosadením premenných odčítaných z multimetrov, haha. Niekto môže namietať, že sa to už robí efektívnejšie, ale systém papier a pero má spoľahlivejší autosave. 🙂
Takže máš dceru, no jo, já se umím trefit, když je zvláště třeba 😅
Do takových lepších značek dávají baterky, které něco vydrží. Baterka v běžném číňanovi, co mám bokem, se odezvou poroučela už za dva roky. Ale má ta holka jiné přednosti, je robustní a věřím, že by přežila i ránu kladivem (výborný předpoklad také pro počítání daní).
Tak mě napadá. Každá tchýně přece nakupuje pouze supervýhodně, mimo jiného i kalkulačky. Je to taková „masovka“, jak se říká, že jo. To budí soucit, no ne?
Tomu se říká stará panna. Měl bys ji už konečně vytáhnout mezi kluky na dílně.