ARM uvádí rekordně výkonné jádro Cortex-X4 s osmi ALU

Nové malé jádro: Cortex-A520

ARM poslední dobou uváděl každý rok novou generaci procesorových jader. A nejinak tomu bude letos, jen tentokrát tuto akci přesunul na veletrh Computex. ARM tam tento rok odhalil kompletní linii nových architektur: nové velké „prime“ jádro Cortex-X4 pro maximální jednovláknový výkon, nové prostřední jádro Cortex-A720, jehož rolí je generovat mnohovláknový výkon (jako E-Core Intelu) a konečně i nové malé úsporné jádro Cortex-A520.

V minulé generaci nebylo nové malé jádro představeno a místo něho se jádra pořád párovala s předchozím Cortexem-A510. To teď ARM napravuje a vydává nové malé jádro Cortex-A520, u kterého zrovna jsou slibována zlepšení poměrně velká – ale v efektivitě místo v rychlosti. Tato jádra zůstanou stále na relativně nízké výkonnostní úrovni. Stále jde o in-order architekturu, ARM tedy nenásleduje Apple, který svá malá jádra koncipuje jako výkonnější out-of-order jádra netriviálního výkonu.

Cortex-A520 není ale totálně nový design, stále vychází jako ze základu z architektury Cortex-A510, zachovává také její sdílenou FPU. Podporuje instrukce ARMv9.2 a je již čistě 64bitový, nemá tedy již legacy kompatibilitu s 32bitovými aplikacemi. Stejně jako předchozí jádra podporuje Cortex-A520 onen nový algoritmus QARMA3 pro bezpečnostní funkci Pointer Autentification.

Zatímco u Cortexu-X4 bylo jádro rozšířeno a u Cortexu-A720 se Arm soustředil na optimalizace efektivity bez rozšíření, Cortex-A520 byl ve jménu efektivity dokonce zúžen. Cortex-A520 zvedl proti Cortexu-A55 počet ALU na tři, ale Cortex-A520 toto revertuje a vrací se jen ke dvěma ALU. Toto zjednodušuje datovou komunikaci mezi jednotkami a issue logiku, takže je ušetřena energie (výkon zřejmě také klesne, ale méně, než spotřeba). Část výkonnostního propadu ARM vykompenzoval jinými úpravami, které mají nižší cenu, než třetí ALU.

Vedle dvou jednoduchých ALU má jádro jednu jednotku vyhrazenou pro celočíselné dělení a násobení a jednu jednotku pro větvení. Dále pak má jádro jednu load/store a jednu čistě load jednotku, podporuje tedy buď dvě čtení, nebo jedno čtení a jeden zápis do paměti za cyklus.

O oněch dalších změnách toho ale ARM zas tak mnoho neříká. Vylepšena byla opět predikce větvení a prefetch, což jsou součásti, které u jakéhokoliv jádra zlepší jeho efektivitu a využití jeho výpočetních zdrojů (hodně se na ně soustředí také třeba AMD, u kterého zřejmě mohou za to, že Zen 4 s menším počtem ALU a dalších jednotek dosahuje cca stejné IPC jako jádra Intelu s výrazně silnějšími výpočetními prostředky i delšími out-of-order frontami).

Jádru zůstaly L1 cache pro data a instrukce s kapacitami volitelně 32 nebo 64 KB a zřejmě je také zůstala ve stejných rysech také sdílená FPU a SIMD jednotka připomínající řešení FlexFPU u architektur AMD Bulldozer, Piledriver, Steamroller a Excavator. U Cortexu-A510 a A520 je ale možné ji volitelně dát každému jádru vlastní.

Obecně AMR uvádí, že se zaměřil na změny, které zvyšují výkon jádra významně, ale stojí jen málo energie (přičemž třetí ALU zřejmě měla opačný efekt). Také prý byl vyladěn pro větší efektivitu paměťový subsystém (load/store jednotky, fronty a cache).

Křivka výkonu a spotřeby pro Cortex-A520

Podle ARMu má Cortex-A520 až o 22 % vyšší energetickou efektivitu proti jádru A510, pokud se vyrobí na stejném výrobním procesu – znamená to, že určitý výkon toto jádro dosáhne při spotřebě o 22 % nižší, než Cortex-A510. Nebo alternativně dokáže v určité limitované hodnotě spotřeby dosáhnout o 8 % vyššího výkonu.

Toto ovšem nemusí škálovat až na nejvyšší možné frekvence, je možné, že pokud byste chtěli přetaktováním vymáčknout maximum, zastaví se Cortex-A520 níž. To ale není scénář, ve kterém tato jádra budou používána. Tato jádra poběží na nízkých frekvencích v roli jader, kterým budou svěřovány úlohy na pozadí, nebo na kterých poběží operační systém v okamžicích, kdy je systém nečinný, čeká na reakci uživatele, nebo běží v úsporném standby režimu.

Zdroje: AnandTech, WikiChip (1, 2, 3)

Jan Olšan, redaktor Cnews.cz



  •  
  •  
  •  
Flattr this!

Apple M4 má rekordní skóre v testech. Přes staré jádro, stejné IPC

Jen před pár týdny se začaly objevovat zprávy o tom, že Apple už teď na jaře uvede novou generaci procesorů M4, přestože předchozí M3 vyšlo s velkou slávou teprve na podzim. Překvapivě se tato zpráva potvrdila a Apple opravdu po takto krátké době vytáhl nový čip (což vyvolává otázky nad povedeností M3). Hned se proto vyrojily dohady, že jde spíš jen o refresh bez nové architektury. Vzápětí ale zase přichází senzační benchmarková skóre. Celý článok „Apple M4 má rekordní skóre v testech. Přes staré jádro, stejné IPC“ »

  •  
  •  
  •  

Samsung opustí grafiky od AMD, pro Exynosy chystá vlastní GPU

Samsung před lety překvapil plánem používat v mobilech dospělou grafiku s architekturou licencovanou od AMD, tedy prakticky integrovaný Radeon. Od té doby vydal dva procesory Exynos, které používaly GPU RDNA 2 a RDNA 3 (v mobilní úpravě). Ale vypadá to, že by to mohlo skončit, Samsung se prý poohlíží po jiných možnostech a zřejmě by chtěl grafiky Radeon opustit a ideálně si vyvinout vlastní náhradu. Celý článok „Samsung opustí grafiky od AMD, pro Exynosy chystá vlastní GPU“ »

  •  
  •  
  •  

Huawei má ARM CPU pro servery, které dohnalo Zen 3. IPC má lepší

Americké sankce na nějakou dobu odstřihly čínský koncern Huawei od nejmodernějších architektur ARM a výrobních procesů u TSMC, ale firmě se, zdá se, podařilo přežít a možná i posílit. Zatímco samotnou křemíkovou výrobu se bude nějak snažit suplovat SMIC, po stránce architektury divize HiSilicon už před zákazy vyvíjela vlastní jádra CPU a teď se s nimi dostala na překvapivě dobrou úroveň. Celý článok „Huawei má ARM CPU pro servery, které dohnalo Zen 3. IPC má lepší“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *