Arm Mali-G77 GPU - kompletní ins a out

Autor: Randy Alexander
Datum Vytvoření: 3 Duben 2021
Datum Aktualizace: 1 Červenec 2024
Anonim
Arm Mali-G77 GPU - kompletní ins a out - Technologie
Arm Mali-G77 GPU - kompletní ins a out - Technologie

Obsah


Spolu s novým jádrem procesoru Cortex-A77, Arm představil GPU nové generace, určený pro smartphony nové generace smartphonů. Mali-G77, který se nesmí zaměňovat s novým zobrazovacím procesorem Mali-D77, označuje odchod architektury Arm Bifrostu a přechod do Valhall.

Za chvíli se dostaneme do jemných detailů nové architektury. Nejprve se nejprve podíváme na to, co by uživatelé měli očekávat, pokud jde o zvýšení výkonu.

Přehled výkonu Mali-G77

Arm se může pochlubit až 40 procentním grafickým zvýšením výkonu u zařízení nové generace Mali-G77 ve srovnání s dnešními modely Mali-G76. Toto číslo zohledňuje proces i architektonická vylepšení. Mali-G77 je konfigurovatelný od 7 do 16 shaderových jader a každé jádro je téměř stejně velké jako jádro G76. To znamená, že špičkové chytré telefony budou pravděpodobně dodávány s podobnými počty procesorů GPU jako dnes - někde u nízkých dospívajících. To nám umožňuje provést spekulativní hodnocení výkonu na základě existujících čipových sad.


Když se podíváme na populární benchmark na Manhattanu GFXBench, zvýšení výkonu o 40 procent otevírá značný náskok před hardwarem současné generace. Čip Adreno nové generace Qualcomm bude potřebovat svůj vlastní významný upgrade výkonu, aby si udržel úroveň hřiště. Zdá se, že tabulky jsou ve prospěch Arm.

Architektura je moudrá, herní výkon se zvyšuje o 20 až 40%, zatímco strojové učení přináší 60% nárůst

Na základě tohoto poněkud hrubého míčového parku vypadá 10jádrový model Mali-G77 (konfigurace, kterou často vidíme od společnosti Huawei), téměř na hraně špičkového mobilního grafického hardwaru této generace. 12jádrová konfigurace, která se obvykle vyskytuje v Exynos od společnosti Samsung, poskytuje velký náskok pro nejnovější GPU Arm. Skutečná měřítka budou samozřejmě záviset na dalších faktorech, včetně procesního uzlu, paměti cache GPU, konfigurace paměti LPDDR a typu aplikace, kterou testujete. Vezměte tedy výše uvedený graf s mohutnou dávkou soli.


Pokud jde o samotnou novou architekturu, Arm uvádí, že Mali-G77 nabízí v průměru o 30 procent zlepšení energetické účinnosti a hustoty výkonu. Díky podpoře produktů INT8 dot existuje také obrovská podpora 60 procent pro aplikace strojového učení. Očekávání herního výkonu jsou stanovena někde mezi 20 a 40 procentní podporou, v závislosti na názvu a typu nabízené grafické práce.

Abychom přesně pochopili, jak Arm dosáhl tohoto výkonu při povznesení, pojďme se hlouběji ponořit do architektury.

Seznamte se s Valhallem, nástupcem Bifrostu

Vahall je Armova skalární architektura GPU druhé generace. Jedná se o 16-široký-warpový spouštěcí motor, což v podstatě znamená, že GPU provádí 16 instrukcí paralelně na cyklus, na jednotku zpracování, na jádro. V Bifrostu je to od 4 do 8 široké.

Mezi další nové architektonické funkce patří dynamické plánování instrukcí spravované výhradně v hardwaru a zcela nová sada instrukcí, která si zachovává provozní ekvivalenci s Bifrostem. Mezi další patří podpora kompresního formátu AFBC1.3 Arm, cíle vykreslování FP16, vrstvené vykreslování a výstupy shaderu vrcholů.

Mali-G77 dělá o 33% více matematiky paralelně než G76.

Klíče k pochopení hlavních architektonických změn se nacházejí zkoumáním prováděcí jednotky uvnitř jádra. Tato část GPU je zodpovědná za drcení čísel.

Uvnitř prováděcího motoru

V Bifrostu obsahovalo každé jádro GPU tři nebo dva výkonné motory v případě některých návrhů Mali-G52 na dolním konci. Každý stroj obsahuje i-cache, registrový soubor a warp řídicí jednotku. V motoru Mali-G72 zpracovává každý motor 4 instrukce za cyklus, který se v loňském roce Mali-G76 zvýšil na 8. Rozšíření po těchto třech jádrech umožňuje 12 a 24 32bitových plovoucí desetinnou čárkou (FP32) instrukcí s vícenásobným akumulováním (FMA) za cyklus.

S Valhall a Mali-G77 je v každém jádru GPU pouze jeden prováděcí motor. Stejně jako dříve i tento motor obsahuje řídicí jednotku osnovy, registr a icache, která je nyní sdílena mezi dvěma zpracovatelskými jednotkami. Každá zpracovatelská jednotka zpracovává 16 warpových instrukcí na cyklus, což je celková propustnost 32 FPMA FMA instrukcí na jádro. To je nárůst o 33 procent, pokud jde o propustnost výuky nad Mali-G76.

Rameno přešlo ze tří na pouze jednu vykonávací jednotku na jádro GPU, ale v jádru G77 jsou nyní dvě procesorové jednotky.

Kromě toho každá z těchto procesorových jednotek obsahuje dva nové matematické funkční bloky. Nová převáděcí jednotka (CVT) zpracovává základní instrukce pro celé číslo, logiku, větev a převod. Jednotka speciální funkce (SFU) urychluje celočíselné násobení, dělení, druhá odmocnina, logaritmy a další komplexní celočíselné funkce.

Standardní jednotka FMA zaznamenala několik vylepšení, podporujících 16 instrukcí FP32 na cyklus, 32 FP16 nebo 64 INT8 tečkových instrukcí produktu. Tyto optimalizace vedou k 60% zvýšení výkonu v aplikacích strojového učení.

Mapovač textur Quad

Další klíčovou změnou v Mali-G77 je zavedení mapovače čtyř textur, a to z dvojitého mapovače textur v předchozí generaci. Mapovač textury je zodpovědný za mapování 3D polygonů ve scéně do 2D reprezentace, kterou vidíte na obrazovce. Je odpovědný za vzorkování, interpolaci a filtrování k vyhlazení úhlu a pohybu obsahu, aby se zabránilo ostrým hranám s nízkou kvalitou.

Nízké náklady na vyhlazování zůstávají na místě, aby pomohly s kvalitou obrazu, ale zdvojnásobení výkonu textury je zde hlavní výhoda. Texturní jednotka nyní zpracovává 4 bilineární texty za hodinu až od 2 dříve, 2 trilineární texty za hodinu a zpracovává rychlejší filtrování FP16 a FP32.

Mapovač čtyřúhelníkové struktury je rozdělen do dvou cest a poskytuje kratší potrubí pro vlákna, která zasáhnou obsah v mezipaměti. Chybná cesta, která zpracovává převod formátu a dekompresi textury, má širší rozhraní pro mezipaměť L2. To je užitečné také pro pracovní zátěž strojového učení, která může často potřebovat stahovat nová data z paměti.

Spojení všeho v Mali-G77

Arm provedl řadu dalších vylepšení pro Mali-G77, aby se časově shodovaly s hlavními změnami architektury Valhall. Řídicí blok je zjednodušen díky konstrukci jediné prováděcí jednotky, zatímco interní dynamický plánovač ve skutečnosti umožňuje flexibilnější vydávání instrukcí uvnitř každého jádra. S vyšším výkonem v každém jádru je datová cesta také kratší a nižší v latenci, až na pouhých 4 cykly od 8 dříve.

Nový design je také lépe sladěn s rozhraním Vulkan API, což zjednodušuje deskriptory řidičů, aby snížily režii řidiče a zlepšily tak výkonnost „na kov“.

Stručně řečeno, Mali-G72 a Valhall dělají z Bifrostu důležité změny, které slibují významné zvýšení výkonu aplikací pro hry a strojové učení. Důležité je, že design zapadá do stejného rozpočtu na energii a oblast jako Bifrost, což zajišťuje, že mobilní zařízení budou schopna nabídnout vyšší špičkový výkon bez obav o náklady na teplo, energii a křemík. Na základě projekcí výkonu by Mali-G77 měli být schopni dát Adreno další generaci Qualcommu dobré peníze.

Aktualizace, 26. února 2019 (12:15 PM ET): Téměř měíc poté, co lovo uniklo, že Google Duo přijde na web, je tato funkce nyní aktivní. tačí navštívit web Google ...

Aktualizace 23. května 2019 (14:34 PM ET): Google nám objanil, jak Duplex funguje, pokud jde o rozdávání úkolů člověku, nikoli botu....

Čerstvé Články