ARM uvádí rekordně výkonné jádro Cortex-X4 s osmi ALU

Cortex-A720: nové prostřední jádro proti E-Core u Intelu

ARM poslední dobou uváděl každý rok novou generaci procesorových jader. A nejinak tomu bude letos, jen tentokrát tuto akci přesunul na veletrh Computex. ARM tam tento rok odhalil kompletní linii nových architektur: nové velké „prime“ jádro Cortex-X4 pro maximální jednovláknový výkon, nové prostřední jádro Cortex-A720, jehož rolí je generovat mnohovláknový výkon (jako E-Core Intelu) a konečně i nové malé úsporné jádro Cortex-A520.

Také Cortex-A715 dostal novou náhradu, pojmenovanou A720. Tato třída jader dříve představovala velká jádra, ale nebyla optimalizovaná až tak moc na jednovláknový výkon, jako spíše na efektivitu a plochu. Poté, co úloha 1T výkonu přešla na Cortexy-X, jsou tato jádra linie Cortex-A specializována zejména na mnohovláknový výkon, jak už bylo řečeno. Takže je můžete vnímat jako obdobu E-Core (nyní architektury Gracemont) u Intelu. V levnějších mobilních SoC ale Cortex-X4 může chybět a Cortex-A720 pak v nich bude mít roli velkého jádra.

U Cortexu-A720 neudělal ARM tak velké změny proti předchozímu designu Cortexu-A715, jaké jste mohli vidět v předchozí kapitole, a jde spíše o evoluční vylepšení. Jádro má být zaměřené zejména na zlepšení efektivity (co do spotřeby, ale i do plochy a ceny). Také přidává podporu instrukční sady ARMv9.2.

Cortex-A720 zřejmě stejně jako Cortex-X4 zredukoval délku pipeline, protože cena za chybně odhadnuté větvení byla zredukována ze 12 na 11 cyklů. Vylepšena byla opět i predikce větvení, ovšem asi ne co do výkonu, ale tak, aby zpracování větvení bylo efektivnější z hlediska spotřebované energie (údajně bez negativního dopadu na výkon). Stejně jako Cortex-X4 nemá jádro A720 žádnou micro-op cache, ale v tomto případě byla odstraněna již předchozím jádrem A715.

Cortex-A720 také stejně jako jádro X4 přešlo na pipelinovanou floating-point děličku, takže i u tohoto jádra se zlepší výkon instrukcí FDIV. Pipelining byl přidán také pro floating-point výpočet druhé odmocniny (FSQRT). Výsledkem je zrychlení těchto operací (asi jak co do latence této instrukce, tak do propustnosti, čili kolik jich jednotka zvládne za určitý počet cyklů) a zároveň podle ARMu nedošlo k významnému zvětšení plochy děličky.

Jednotka FPU má také zrychlenou práci při převodu hodnot z floating-point a SIMD (Neon, SVE / SVE 2) registrů do obecných integerových registrů. Trvá tedy kratší dobu, než jsou výsledky z těchto instrukcí přístupné pro další zpracování mimo FPU. Předávání dat mezi částmi jádra (forwarding network) bylo zlepšeno také směrem do jednotek AGU provádějících zápis do paměti (cache) a také se zlepšila práce load/store front.

Cortex-A720 má také zrychlenou L2 cache, která má latenci jen 9 cyklů proti 10 u předchozího Cortexu-A715. Minimálně pro některé druhy operací byla vylepšená také její datová propustnost. Podle ARMu totiž operace MemSet v L2 cache probíhají až 2× rychleji.

Jádro má také opět vylepšené prefetechery, což je spolu s prediktory větvení oblast, která bývá kontinuálně vylepšována v prakticky každé nové generaci a má přímý vliv na zlepšení IPC. Jádro by nově mělo mít spatial prefetching do L2 cache, který byl předtím jen u jader Cortex-X.

O trošku lepší výkon, ale hlavně efektivita

Podle ARMu by jádro Cortex-A720 mělo mít výkon vyšší o 1–13 % proti Cortexu-A715, přičemž úlohu od úlohy se to bude lišit (v průměru bude asi zlepšení jen okolo 5 %). Toto by mělo být na stejném výrobním procesu. O něco více má stoupnout efektivita, ta má na stejném procesu být údajně v průměru o nějakých 6 % lepší (v praxi se to ale bude lišit aplikaci od aplikace). Tento rozptyl můžete vidět na grafu pro úlohy benchmarků SPEC.

Zlepšení výkonu a efektivity u Cortexu-A720

ARM u tohoto jádra nabízí několik možností konfigurace, vedle výkonnější možnosti má také existovat verze, která má při implementaci mít zhruba stejnou plochu jako Cortex-A78 (design z roku 2020). Tato konfigurace má nižší výkon, ale stále má být o 10 % rychlejší než toto starší jádro. Jejím smyslem je použití v SoC pro levné telefony, které používají stará jádra jako Cortex-A76 a právě A78. Tato osekaná verze Cortexu-A720 by mohla jejich výrobce přimět, aby konečně přešli na novější architekturu s instrukční sadou ARMv9.

Článek pokračuje na další straně.

  •  
  •  
  •  
Flattr this!

Microsoft má vlastní ARM procesory. A k nim i čipy pro AI

Už nějakou dobu se šíří informace o tom, že Microsoft pracuje na vlastních čipech pro akceleraci umělé inteligence, kterými by ve svých datacentrech doplnil, pokud ne rovnou nahradil značně drahá GPU od Nvidie. Společnost je teď skutečně oficiálně oznámila, ale nezůstalo jen u akcelerátorů AI. Microsoft představil také vlastní procesory pro servery založené na architektuře ARM, kterými se zařadí po bok Amazonu a jeho Gravitonů. Celý článok „Microsoft má vlastní ARM procesory. A k nim i čipy pro AI“ »

  •  
  •  
  •  

MediaTek Dimensity 9300: Procesor pro telefony s 8 velkými jádry

Qualcomm příští rok přinese na trh notebooky s výkonnými ARM procesory Snapdragon X Elite založenými na jádru Oryon původně od firmy Nuvia založené inženýry z Applu. Hodně zajímavý ARM procesor ale chystá také MediaTek. Jeho Dimensity 9300 používá architekturu licencovanou od ARMu, ale jako jeden z mála mobilních procesorů dostal čistě samá velká jádra. A není to přitom SoC pro notebooky, ale pro telefony. Celý článok „MediaTek Dimensity 9300: Procesor pro telefony s 8 velkými jádry“ »

  •  
  •  
  •  

Technologie FSR v mobilech, Qualcomm a Samsung spojí síly s AMD

TechPowerUp v pondělí upozornil na zprávu leakera, který vystupuje na Twitteru pod přezdívkou Revegnus (či handlem Tech_Reve) a vypouští různé zprávy o mobilních telefonech. Ten přišel s informací, podle které se AMD ve vývoji upscalingu pro hry (který se používá pro zvýšení jejich snímkové frekvence tím, že se sníží interně zpracovávané rozlišení) s Qualcommem a Samsungem a všechny tři firmy by používaly technologii FSR. Celý článok „Technologie FSR v mobilech, Qualcomm a Samsung spojí síly s AMD“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *