Nieuwe Amazon EC2 aangedreven eigen ML-inferentie-chip

Amazon Web Services heeft een nieuwe Elastic Compute Cloud (EC2)-instance aangekondigd, die wordt aangedreven door een op maat gemaakte krachtige machine learning inferentie-chip. De chip zorgt voor een zeer hoge doorvoer, lage latentie en duurzame prestaties.

Volgens Andy Jassy, CEO van AWS, hebben de zogeheten Inf1-instanties een drie keer hogere doorvoer en tot 40 procent lagere kosten per inferentie, vergeleken met instances gebaseerd op Nvidia G4-chips.

AWS bouwde de Inf1-instances rond de zelf ontwikkelde Inferentia-accelerator. Inf1 is beschikbaar in vier smaaktjes met van 1 tot 16 Inferentia-accelerators aanboord, bijgestaan door Inten Xeon Scalable-processors van de tweede generatie. Het type verschilt ook hier per instance, met 4 vCPU’s voor het instapproduct en 64 voor de zwaarst beschikbare oplossing. Die laatste heeft een doorvoercapaciteit tot 100 Gigabit en telt verder nog 192 GB aan RAM-geheugen.

Organisaties die veel met machine learning doen op schaal en in productie weten volgens Jassy als geen ander dat het grootste deel van de kosten in voorspellingen gaan zitten, aldus ZDnet.

Machine learning, dat trainingsalgoritmen en gevolgtrekkingen omvat, is steeds vaker een integraal onderdeel van een applicatie. Al komt het met een aantal unieke eisen. Bij inferentie wordt een getraind machine learning-model daadwerkelijk in gebruik genomen en kan eenvoudig het overgrote deel van de kosten voor een machine-leersysteem verklaren.

Alexa en zelfrijdende auto’s voeren inferentie uit

Als Amazon’s spraakassistent Alexa een opdracht van een gebruiker interpreteert, voert deze ‘inferentie’ uit. Dat geldt bijvoorbeeld ook voor een zelfrijdende auto. Steeds wanneer een machine learning-model wordt getraind om objectherkenning voor een zelfrijdende auto uit te voeren en een object op de weg ziet, voert het inferentie uit.

In beide scenario’s speelt latentie in verschillende mate een grote rol. Hoe sneller Alexa een opdracht interpreteert, hoe sneller het kan reageren. Hoe sneller een zelfrijdende auto een object op de weg identificeert, hoe sneller een botsing kan worden voorkomen. Daar kan de nieuwe, krachtige machine learning inferentie-chip nu voor zorgen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Nieuwe Amazon EC2 aangedreven eigen ML-inferentie-chip

Alexa en zelfrijdende auto’s voeren inferentie uit

gerelateerd nieuws

nieuwsbrief