Azure omarmt AMD MI200 GPU-clusters voor AI-training op grote schaal

microsoft-azure

Microsoft Azure is de eerste public cloud waar je de nieuwste AMD MI200-serie GPU kan gebruiken voor AI-trainingen. Prestaties liggen tot vijf keer hoger dan de huidige topchip van Nvidia.

Eind vorig jaar lanceerde AMD de Instinct MI200-familie van accelerators met de MI250X als vlaggenschip als antwoord op de Nvidia A100. Vandaag kan je de nieuwe GPU’s van AMD voor het eerst in de public cloud gebruiken voor AI-training. Microsoft Azure heeft de primeur te pakken.

AMD heeft hoge verwachtingen van zijn nieuwe accelerators en steekt dat niet onder stoelen of banken. De fabrikant publiceerde daarom gedetailleerde benchmarks die aantonen dat de MI250X een stuk krachtiger is dan de Nvidia A100. Binnen de hoge precisie FP64-berekeningen presteert de AMD-chip bijna vijf keer sneller. Kijken we naar de meer algemene FP16-workloads, dan presteert de AMD MI250X tot 20 procent sneller dan de Nvidia A100.

Het is vandaag nog koffiedik kijken wanneer de nieuwste AMD-chips algemeen beschikbaar zijn binnen de Azure-cloud. Voorlopig maakt Microsoft de extra rekenkracht voor AI-trainingen enkel voor interne workloads beschikbaar waarbij het nauw samenwerkt met AMD voor PyTorch-optimalisaties.

Nvidia en Intel zitten niet stil

Nvidia zit ondertussen niet stil en werkt aan een nieuwe chip gebouwd op de splinternieuwe Hopper-architectuur. De Nvidia H100 moet opnieuw ’s werelds krachtigste accelerator zijn. Nvidia perst 80 miljard transistors op de chip met de hulp van TSMC’s ultramoderne 4 nm-bakproces. De GPU ondersteunt PCIe Gen 5 en gebruikt als allereerste chip ter wereld HBM3-geheugen, goed voor een geheugenbandbreedte van 3 TB/s. Wat klassieke rekenkracht betreft is de Nvidia H100 drie keer sneller dan de Nvidia A100.

lees ook

Datacentertak van Nvidia draait hogere omzet dan gamingdivisie

Tegelijk landt dit jaar normaalgezien ook een heel krachtige datacenter-GPU van Intel onder de naam Ponte Vecchio. De chip krijgt ongeveer 100 miljard transistoren en krijgt 47 individuele chiplets gebouwd met vijf verschillende fabricagenodes afkomstig van verschillende fabrikanten. De accelerator wordt in de praktijk deels door Intel en deels door TSMC gebouwd. De chiplets wonen niet naast alleen naast elkaar maar ook boven en onder elkaar met dank aan de driedimensionale Foveros-technologie van Intel zelf.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.
terug naar home