Intel stelt enorme Ponte Vecchio-GPU voor met focus op HPC

Intel wil zich moeien in de acceleratormarkt en sleutelt daarom aan een eigen superkrachtige datacenter-GPU: Ponte Vecchio. In een eerste voorstelling van de chip zien we wat dat precies inhoudt.

Tijdens zijn jaarlijkse Architecture Day laat Intel zien hoe zijn toekomstige Ponte Vecchio-GPU er zal uitzien. Die chip wordt een enorme AI-accelerator gericht op datacenters en HPC-installaties. Intel meent het: de eerste gekende klant van Ponte Vecchio is het Amerikaanse energiedepartement dat de Aurora-supercomputer ermee wil upgraden.

Specificaties

De ambities zijn er dus naar, maar wat is Ponte Vecchio precies? Tijdens zijn event toont Intel een enorme chip met ongeveer 100 miljard transistors. De extreem krachtige Nvidia A100 heeft ongeveer de helft. De hoeveelheid transistors illustreert hoe groot en complex Ponte Vecchio wel is. De accelerator is gebaseerd op de splinternieuwe Xe-architectuur van Intel, waarvan we al varianten gericht op grafische workloads terugvinden in onder andere de Intel Tiger Lake-CPU’s.

Intel verklapt verder dat Ponte Vecchio is opgebouwd uit maar liefst 47 individuele chiplets gebouwd met vijf verschillende fabricagenodes afkomstig van verschillende fabrikanten. De accelerator wordt in de praktijk deels door Intel en deels door TSMC gebouwd. De chiplets wonen niet naast alleen naast elkaar maar ook boven en onder elkaar met dank aan de driedimensionale Foveros-technologie van Intel zelf.

Iedere Ponte Vecchio-chip bestaat uit verschillende Compute Tiles die zelf ieders acht Xe-kernen bevatten. Die Xe-kernen bestaan zelf uit telkens acht bector engines en acht matrix engines. De Compute Tiles worden bijgestaan door Xe Link Tiles. Dat zijn chiplets die een naadloze verbinding met andere Ponte Vecchio-chips in een systeem faciliteren. Dat is belangrijk aangezien een accelerator in een HPC-systeem nooit alleen werkt. De chips moeten onderling vlot het werk kunnen verdelen. De fundering van het geheel is de Base Tile. Daarop vind je naast de Compute Tiles en de Xe Link Tiles nog enkele andere chiplets zoals geheugenmodules.

Krachtig

Intel claimt dat zijn enorme chip 45 teraflops aan FP32-rekenkracht in zich heeft. Ter vergelijking: Nvidia claimt 19,5 teraflops voor zijn A100. Weet wel dat dat een artificieel cijfer is en de optimalisatie van algoritmes een grote impact zal hebben op werkelijke prestaties. Voor ResNet-50 v1.5-inferentie claimt Intel alvast dat zijn GPU een stuk sneller is dan het beste wat de concurrentie in petto heeft.

Ponte Vecchio is een belangrijke chip voor Intel, dat met de GPU een salvo voor de boeg van Nvidia lost. Een combinatie van eigen CPU’s en krachtige accelerators kan wel eens wat verschuivingen teweegbrengen in de markt.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.