Opět čínské GPU ambice, výrobce procesorů Loongson chystá grafiku

Vlastní GPU k procesorům architektury LoongArch

Zřejmě je to hlavně unikátní kombinací poptávky shora po vlastním řešení a vládních subvencí, ale v Číně se v posledních letech vynořilo množství firem snažících se o vývoj vlastního GPU a grafických karet pro tamní trh. Přitom globálně se skoro dvacet let do samostatných GPU nikdo mimo Intelu (a kdysi VIA/S3) prorazit nepokusil. V Číně to ale teď zkouší i Loongson vyrábějící procesory, takže by mohl mít zajímavé kompletní řešení.

Loongson je na rozdíl od ostatních soutěžících stará firma, a nikoliv startup, už dlouhou dobu vyvíjí lokální čínská CPU, původně s variantou instrukční sady MIPS, později s vlastní novou (nebo možná lépe řečeno upravenou) nazvanou LoongArch. Zatímco vlastní CPU má tato firma dlouho, chyběla jí kompletní platforma. Jednu dobu dokonce používala se svými procesory čipset od AMD (připojený přes Hyper Transport) a celou dobu procesory Loongson vyžadují samostatné GPU.

Firma proto před časem oznámila vývoj grafického jádra a nakonec s ním má vzniknout i samostatné GPU. To má označení Loongson 9A1000. Jeho primární rolí sice bude zajistit prostě možnost připojení monitoru k počítači platformy LoongArch a provozu grafického operačního systému, pracovní plochy a obvyklých programů, ale bude mít i výpočetní výbavu a schopnost grafické akcelerace jako plnohodnotné GPU, byť ne nijak rychlé.

Loongson 9A1000

Firma nyní o grafice 9A1000 mluvila při oznámení hospodářských výsledků. Toto GPU má údajně poskytnout kartu srovnatelnou zhruba s Radeonem RX 550, což je na dnešní poměry dost stará (2017) a nevýkonná grafika, pokud jde o herní výkon. Je ale reálně stále prodávaná, podobně jako třeba GeForce GT 1030 (a asi s podobným určením, o které jde Loongsonu). Radeon RX 550 obsahuje čip Polaris 12, který poskytuje 8 CU architektury Polaris (512 shaderů) a 128bitové paměťové rozhraní. Hrubý výkon byl s takty lehce nad 1 GHz tehdy uváděné 1,2 TFLOPS ve výpočtech s přesností FP32.

Grafika Loongson 9A1000 má údajně mít podobný výkon, ale těžko říct, zda to bude platit v praxi, nebo jsou tím míněné třeba jen teoretické TFLOPS dané počtem jednotek a frekvencí. Pro GPU je obtížné přetavit takový teoretický výkon do reálného výkonu v aplikacích, což vyžaduje neobyčejně komplexní ovladače, které jsou v podstatě ten pravý důvod, proč se do rybníku Nvidie, AMD (a Intelu, který se opírá o své dlouhodobě existující integrované GPU) nedařilo nikomu dalšímu nasadit vlastní ryby. Dá se proto očekávat, že i u grafiky Loongson 9A1000 budou ovladače limitujícím faktorem a například ve hrách moc dobře fungovat nebude, vedle použití pro základní desktopové zobrazení. S tím má velké problémy i zatím nejpovedenější GPU z Číny od Moore Threads Technology. Teoreticky mělo konkurovat RTX 3060 Ti, prakticky často má problémy s GeForce GTX 1050, ne-li GT 1030.

Grafická karta Moore Threads MTT S80 (zdroj: Moore Threads)

Podle šéfa a zakladatele Loongsonu Hu Weiwu bude GPU podporovat vědecké výpočty (tedy „GPGPU“ využití programovatelných ve výpočetních jednotkách), což je dnes ovšem zcela standardní. Také má umět akceleraci AI, ale i tady pravděpodobně může být řeč o použití standardních výpočetních jednotek, byť je také možné, že firma bude s ohledem na budoucí použití od začátku do architektury přidávat i nějaké specializované AI jednotky podobné tensor core u Nvidie. Naopak není zmíněno, zda bude GPU mít podporu akcelerace enkódování a dekódování videa. Bloky pro tuto funkci lze licencovat, a nemělo by být tak těžké je začlenit, takže je asi lze očekávat.

Na trhu v roce 2025

Loongson je na sankčním seznamu USA, což mu asi znemožní toto GPU vyrábět v TSMC. Pravděpodobně tedy čipy počítají s výrobou v čínské továrně SMIC a první generace nejspíš bude na starším procesu. Podle Loongsonu bude tapeout příští rok v třetím kvartálu, tedy až za rok. Po tapeoutu typicky bývá třeba ještě nějaký rok, než se podaří produkt vydat, takže grafiky Loongson 9A1000 asi budou vydané až v roce 2025.

Dlouhé vývojové cykly byly problémem Loongsonu i u procesorů, je tedy otázka, zda tedy skutečné nasazení nebude trvat ještě déle. Nakonec ovšem nejdůležitější přínos tohoto vývoje může být, až toto GPU bude integrováno k procesorům, které tak budou konečně schopné fungovat jako kompletní SoC a již nebude vyžadováno osazování jakéhokoli samostatného GPU.

Zdroj: Tom’s Hardware

Jan Olšan, redaktor Cnews.cz


  •  
  •  
  •  
Flattr this!

[Update] Zákaz exportu GPU do Číny: GeForce RTX 4090D zůstává

USA loni začaly uplatňovat embargo na vývoz výkonných GPU do Číny, což má chránit jejich strategickou bezpečnost tím, že ztíží Číně vývoj pokročilých AI například pro vojenské účely. Na podzim zákaz nastavil limity výkonu tak, že nedovolily vývoz GeForce RTX 4090, na což ale Nvidia zareagovala modelem GeForce RTX 4090D, který má ořezané výpočetní jednotky a výkon tak, aby se do stanovených limitů přesně vešel. Nyní však byl zakázaný také. Celý článok „[Update] Zákaz exportu GPU do Číny: GeForce RTX 4090D zůstává“ »

  •  
  •  
  •  

Čínské SMIC chystá 3nm výrobní proces. Bez EUV bude mít problém

Loni se objevily informace o čínském 5nm výrobním procesu od společnosti SMIC (byť možná bude mít blíž k vylepšené generaci 7nm technologie, kterou mělo SMIC dříve plánovanou). Tyto snahy o čínskou soběstačnost ve špičkových výrobních procesech budou pokračovat. SMIC nyní plánuje dokonce i 3nm výrobní proces. Západní sankce ale mají vliv – pokud se firmě podaří takovou technologii vyvinout, výroba dost možná bude ekonomicky nevýhodná. Celý článok „Čínské SMIC chystá 3nm výrobní proces. Bez EUV bude mít problém“ »

  •  
  •  
  •  

Huawei má ARM CPU pro servery, které dohnalo Zen 3. IPC má lepší

Americké sankce na nějakou dobu odstřihly čínský koncern Huawei od nejmodernějších architektur ARM a výrobních procesů u TSMC, ale firmě se, zdá se, podařilo přežít a možná i posílit. Zatímco samotnou křemíkovou výrobu se bude nějak snažit suplovat SMIC, po stránce architektury divize HiSilicon už před zákazy vyvíjela vlastní jádra CPU a teď se s nimi dostala na překvapivě dobrou úroveň. Celý článok „Huawei má ARM CPU pro servery, které dohnalo Zen 3. IPC má lepší“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *