ARM má GPU s podporou ray tracingu pro mobily: Immortalis-G715

ARM Immortalis-G715: nová generace architektury Vallhal přináší víc FP32 jednotek, VRS a ray tracing

Tento týden ARM oznámil nové architektury CPU (už jsme psali o novém velkém jádru Cortex-X3, které bude nejrychlejší architekturou ARMu, a novém efektivním jádru Cortex-A715). S nimi ale také oznámil nové GPU pro mobilní čipy – novou generaci Mali, ale také novou řadu grafik nazvanou Immortalis. A ta je velmi zajímavá: přináší totiž podporu raytracingových efektů, které teď podle ARMu mohou nastoupit do mobilních her.

ARM v letošní sérii licencovatelného „IP“ představil tři návrhy GPU pro mobilní procesory: Mali-G715, levnější Mali-G615 a pak prémiovou architekturu nazvanou již ne Mali, ale Immortalis-G715. Jsou založená na základně čtvrté generace grafické architektury Valhall, která se poprvé objevila v Mali-G77 a poté v Mali-G78/G68 a Mali-G710/G610.

Generace GPU ARM pro rok 2022 (zdroj: ARM, via: ComputerBase)

Tři zmíněná nová GPU se liší výkonem implementace této společné architektury a částečně funkcemi. Mali-G615 je varianta pro levné SoC, která má mít 6 nebo méně grafických „jader“ (6 jader by mělo odpovídat 384 shaderům/jednotkám FP32). Lepší Mali-G715 se liší tím, že může mít 7-9 jader (448–576 shaderů).

Nejzajímavější verze Immoratalis-G715 podporuje 10 až 16 jader (640–1024 shaderů), zejména se ale liší tím, že grafická jádra mají přidané jednotky pro hardwarovou akceleraci raytracingových efektů, tedy obdobu RT Cores v GPU Nvidia a Ray Acceleratorů v GPU od AMD.

GPU ARM Immortalis-G715 (zdroj: ARM, via: ComputerBase)

Valhall IV se inspiroval u Nvidia Ampere

Použitá architektury Valhall 4. generace má vedle podpory ray tracingu (ve verzi Immortalis) také docela závažné obecné změny. Nejdůležitější novinka je něco podobajícího se přidání dalších shaderových jednotek, které Nvidia provedla v architektuře Ampere (s předstupněm v Turingu). Předchozí třetí verze architektury Valhall měla v každém jádru 32 shaderů – ve dvou Execution Enginech po 16 shaderech (předchozí generace měly jen jeden). Tyto dva Execution Enginy mají společný frontend, load-store část a texturovací a další fixní jednotky.

Execution Engine architektury Valhall před čtvrtou generací (zdroj: ARM, via: ComputerBase)

Nová čtvrtá generace do každého Execution Engine zavedla dvojnásobný počet FP32 jednotek (ARM o nich mluví jako o DMA jednotkách), přesněji by mělo jít o to, že zatímco dříve měl Engine jednu SIMD jednotku o 16 „pruzích“, teď jsou tyto SIMD16 jednotky FMA dvě. V jednom Execution Enginu je tedy nyní 32 shaderů a v celém jádru 64. Podobně jako u Nvidie (a možná u AMD v RDNA 3) se tedy zvýšil počet FP32 shaderů na jednu základní výpočetní jednotku.

Execution Engine architektury Valhall čtvrté generace se zdvojenými jednotkami FMA (zdroj: ARM, via: ComputerBase)

Toto je podle ARMu efektivnější způsob zvýšení hrubého výkonu, protože neroste počet fixních jednotek a různé další funkcionality a řídící logiky. Dvojnásobný hrubý výkon v FP32 výpočtech (aspoň teoretický) byl dosažen výměnou za jen 27% zvětšení plochy.

Zdvojnásobení jednotek FMA v poměru k celkovému zvětšení plochy GPU (zdroj: ARM, via: ComputerBase)

Zlepšení efektivity

ARM uvádí i další zlepšení nových GPU. Jednotky FMA mají podporovat také maticové operace (MMUL) pro akceleraci AI (což má také 2× zlepšit výkon pro tyto operace) a řada dalších bloků údajně doznala zlepšení výkonu, zabrané plochy na čipu a/nebo spotřeby.

Tiler (GPU ARMu používají tile-based rendering) by údajně měl špičkově zvládat až 3× více trojúhelníků. Další zlepšení mají být v rychlejším Command Stream Frontendu, v load-store části, v mapování textur a byla přidána podpora komprese textur AFRC (ARM Fixed Rate Compression), která šetří spotřebovanou propustnost paměti.

Jednotka RTU pro raytracing

Raytracingové efekty bude v Immortalis-G715 počítat specializovaná jednotka RTU (Ray Tracing Unit) umístěná v každém grafickém jádru, jejich počet v GPU by tedy měl odpovídat počtu „jader“ (10 až 16). Tato jednotka podle slajdů funguje na stejném principu jako akcelerace raytracingu v DirectX 12 Ultimate (DXR) u Radeonů a Nvidií.

Akcelerace ray tracingu jednotkami RTU v GPU Immortalis-G715 (zdroj: ARM, via: ComputerBase)

Při výpočtech raytracingu se používá BVH (Bounding Volume Hierarchy) Traversal, kdy se nejprve hledají průsečíky paprsku s „boxy“ členícími objekty na scéně a nakonec se analyzuje již přímo průnik s trojúhelníky tvořícími objekt v rámci nalezeného boxu. RTU v GPU architektuře Immortalis-G715 akceleruje jak hledání průsečíku s boxy, tak s trojúhelníky. Ostatní operace jako třeba denoising pak přebírají standardní shaderové jednotky.

Akcelerace ray tracingu jednotkami RTU používá analýzu BVH stromu (zdroj: ARM, via: ComputerBase)

Podle ARMu jsou jednotky RTU poměrně malé a neměly by tedy integrovanou grafiku moc prodražit – údajně zabírají jen 4 % plochy jádra, ale jejich použití zlepšuje výkon raytracingových efektů až o 300 % proti tomu, kdyby se počítaly čistě „softwarově“ jen pomocí shaderů, což už bylo podporováno v ovladačích předchozí generace Mali-G710. Zní to podobně jako zrychlení, jaké Nvidia zhruba uváděla pro první generaci raytracingových GPU Turing.

Akcelerace ray tracingu jednotkami RTU v GPU Immortalis-G715 (zdroj: ARM, via: ComputerBase)

Ray tracing v mobilních hrách zralý na boom?

Architektura Immortalis-G715 je první od ARMu, které podporu raytracingových efektů přináší, ale není první obecně. V grafikách pro PC tuto funkcionalitu již nyní mají všichni tři konkurenti (Nvidia od GeForce RTX 2000/Turing, AMD v Radeonech RX 6000/RDNA 2 a Intel v nedávno vydaných grafikách Arc).

Podpora se ale již objevila i v mobilních GPU, a to v PowerVR od Imagination, která byla vůbec průkopníkem v experimentech s raytracingem, ale nikdy se jí tuto technologii do mobilů nepodařilo prosadit. Poslední generace mobilních GPU Imagination již má také akceleraci ray tracingu standardně. Arm má ale již v mobilech přichystanou konkurenci v podobě architektury AMD RDNA 2, kterou má včetně podpory ray tracingu licencovanou Samsung pro své mobilní čipy Exynos 2200. Kdo zatím raytracingové GPU nenabízí, je Qualcomm ve svých GPU Adreno a Apple ve stých vlastních GPU, které vycházejí z technologií Imagination PowerVR, s různými úpravami Applu.

Podle ARMu je právě teď dobrá doba, aby se raytracingové efekty objevily v mobilním hraní – partneři a vývojáři her jsou podle firmy připravení, i když rozšiřování asi může ještě trvat a být jen pozvolné. Podobného názoru je ale i již zmíněný Samsung, takže ARM zde není jediný, kdo tlačí na pilu.

Variable Rate Shading v GPU od ARMu

Přidání podpory ray tracingu není ovšem jediná významná změna v těchto GPU. Zdá se, že ARM míří na podporu i dalších technologií z DirectX 12 Ultimate. Všechna tři nová GPU (tedy i levnější Mali-G615 a Mali-G715) mají nově podporu technologie Variable Rate Shading, jejíchž využití dokáže ušetřit výkon shaderů tím, že se adaptivně shadery provádí nikoliv v plném rozlišení, ale například jen na blok 2×2 pixelů.

Variable Rate Shading v GPU ARM Mali-G715, G615 a Immortalis-G715 (zdroj: ARM, via: ComputerBase)

Podle ARMu může Variable Rate Shading v některých případech zlepšit výkon až o 40 %, ale v kontextu mobilního hraní je také důležité to, že může snížit množství energie, které výpočet grafiky spotřebuje, a tedy prodloužit výdrž a baterie.

Variable Rate Shading v GPU ARM Mali-G715, G615 a Immortalis-G715 (zdroj: ARM, via: ComputerBase)

Pravidelné aktualizace ovladačů separátně od operačního systému, jako na Windows

Je ještě jedna menší změna, která má s těmito novými architekturami GPU spojena, ale mohla by hrát důležitou roli. V počítačích jsme zvyklí na to, že výrobci GPU vydávají pravidelné aktualizace ovladačů, které jsou docela stěžejní pro dobré fungování her a opravy chyb v nich. Na mobilních platformách to tak ale úplně nefunguje.

ARM ale uvádí, že architektury Mali-G615/G715 a immortalis-G715 začnou také dostávat četnější aktualizace, které nebudou spojené s aktualizací jádra OS a celého systému. Novější ovladače budou GPU dostávat přes obchod Google Play, což by obešlo známou bariéru v podobě aktualizací systému Android.

Zdroje: ARM, ComputerBase

Jan Olšan, redaktor Cnews.cz


  •  
  •  
  •  
Flattr this!

Přichází levnější ARM procesory s jádry „Nuvia“ pro notebooky

Před nedávnem se objevily zprávy o tom, že Qualcomm chystá další ARM procesor pro notebooky, který by rozšířil nabídku směrem dolů, a počítače s ARMem a Windows by se tím dostaly na o něco nižší počáteční cenu. Teď Qualcomm skutečně vydal nové modely procesorů Snapdragon X Plus, a je jich dokonce víc. Zejména ale teď dost vylepšil levnější modely. Mají totiž konečně slušný jednovláknový boost, který byl doteď slabinou. Celý článok „Přichází levnější ARM procesory s jádry „Nuvia“ pro notebooky“ »

  •  
  •  
  •  

MediaTek chystá CPU pro PC s Windows. Levné ARM notebooky?

Na počítače s procesorem ARM (se systémem Windows) má zatím exkluzivitu Qualcomm, ale brzo by snad měla skončit a s jejich výběrem by to mohlo být hodně zajímavé. ARM procesory pro PC teď podle posledních zpráv začne vyrábět i MediaTek. Ten často poskytuje SoC pro levnější mobily nebo Chromebooky, takže jeho čipy by mohly konečně naplnit naděje, že by třeba notebooky s ARMem mohly být levnější než ty s AMD nebo Intelem. Celý článok „MediaTek chystá CPU pro PC s Windows. Levné ARM notebooky?“ »

  •  
  •  
  •  

ARM jádro Oryon procesorů Snapdragon X: Rozbor architektury

Na Computexu 2024 byly Intelem představeny nové architektury Lion Cove a Skymont, kterým jsme se podrobně věnovali. AMD také nakouslo jejich konkurenta Zen 5, ovšem zatím jen letmo, takže kompletní rozbor architektury bude teprve v budoucnu. Těmto x86 procesorům přichází konkurovat vyzyvatel s instrukční sadou ARM – Snapdragon X Elite přicházející do notebooků. A Qualcomm teď také konečně poodhalil jeho „Nuvia“ architekturu Oryon. Celý článok „ARM jádro Oryon procesorů Snapdragon X: Rozbor architektury“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *