AWS kondigt de algemene beschikbaarheid aan van zijn Elastic Compute Cloud (EC2) DL1 instances aan. Hoewel dit instances-type niet geheel nieuw is, is het wel het eerste exemplaar dat AWS speciaal heeft ontworpen voor het trainen van machine learning-modellen. De instances worden ondersteund door Gaudi accelerators van Habana Labs.
In een blogpost legt Habana uit dat de nieuwe AI training-instance het eerste exemplaar van AWS is dat niet is gebaseerd op GPU’s. Met de nieuwe instances wil AWS zijn klanten voorzien van een 40 procent betere prijs-prestatieverhouding ten opzichte van exemplaren die draaien op GPU’s.
De DL1 instances maken gebruik van tot 8 Gaudi accelerators die speciaal gebouwd zijn om training te versnellen. Daarnaast hebben ze 256GB aan HBM, 758 GB aan systeemgeheugen, tweede generatie op Amazon aangepaste Intel Xeon Scalable processoren, 400 Gbps aan netwerk doorstroom en tot 4TB aan lokale opslagruimte.
Betere prestaties voor een lagere prijs
Grote bedrijven ontdekken steeds meer wat een enorme impact machine learning kan hebben op hun organisatie. Het gebruik van machine learning begint doorgaans met het trainen van een model om patronen te herkennen uit datasets. Vervolgens wordt het model op nieuwe data toegepast om voorspellingen te maken.
Om te zorgen dat deze voorspellingen accuraat blijven, moet een model regelmatig opnieuw getraind worden. Hier zijn aardig wat middelen voor nodig, waardoor de kosten van organisaties snel oplopen. Met zijn nieuwe door Habana-aangedreven instances verwacht AWS de prestaties ten opzichte van de kosten met tot wel 40 procent te kunnen verbeteren.
Nog niet beschikbaar in Europa
De nieuwe DL1 instances zijn te gebruiken als aanvulling op de AWS Trainium hardware van Amazon. Deze aangepaste accelerator set wordt dit jaar nog beschikbaar voor AWS-klanten.
DL1 instances zijn te koop als on-demand instances met besparingsplannen, als reserved instances of spot instances. Op dit moment zijn ze enkel nog beschikbaar in de US East en US West-regio’s van AWS.