OVHcloud kiest SambaNova als motor achter nieuwe AI-inferencingdienst

OVHcloud

OVHcloud gaat samenwerken met SambaNova om AI-inferencing met zeer lage latency te leveren, gericht op toepassingen waar snelheid en betrouwbaarheid cruciaal zijn.

Tijdens de jaarlijkse OVHcloud Summit in Parijs kondigt de Europese cloudspeler de ondersteuning aan voor SambaStack-infrastructuur van SambaNova voor AI-endpoints. SambaNova maakt gebruik van herconfigureerbare dataflow-units (RDU’s), gespecialiseerde chips die ontwikkeld zijn voor AI-inferencing. De technologie moet organisaties ondersteunen bij taken zoals financiële handel, cyberbeveiliging, industriële automatisering en logistieke optimalisatie.

De samenwerking beoogt betere prestaties op vlak van ’time to first token’ en ’time per output token’, twee belangrijke parameters bij het uitvoeren van grootschalige AI-workloads. De nieuwe dienst is bedoeld voor zowel real-time toepassingen met gegarandeerde prestaties, als batch-API’s die grote hoeveelheden aanvragen kunnen verwerken wanneer directe respons niet nodig is. De beschikbaarheid van een 99,8% uptime SLA geeft aan dat OVHcloud mikt op productieklare omgevingen.

Aanvulling op GPU-aanbod van OVHcloud

De SambaNova-infrastructuur vormt een aanvulling op de bestaande GPU-gebaseerde AI-endpoints van OVHcloud. De technologie zou efficiënter gebruik maken van energie en datacentercapaciteit en meer rekencapaciteit leveren per kilowattuur. Dat maakt het geschikt voor AI-agenten, livevertaling, agent-naar-agent communicatie, en grootschalige batchverwerking zoals web crawling of datasetvernieuwing.

lees ook

OVHcloud zet AI in voor duurzame koeltechnologie in datacenters

Voor OVHcloud is de samenwerking met SambaNova een strategische zet om zijn AI-aanbod te verbreden en in te spelen op de groeiende vraag naar performante inferencing. De dienst komt nog voor het einde van het jaar beschikbaar in regio’s binnen Frankrijk. Latere uitbreiding naar andere Europese landen staat op de planning. De dienst wordt aangeboden via een pay-as-you-go model met een verplichte verbintenis.

Berlijn en kwantum

In aanloop naar de OVHcloud Summit in Parijs kondigde de Europese cloudspeler de opening van een cloudregio in Duitsland. Het is de eerste dergelijke regio van het bedrijf in Duitsland, en de derde in Europa na eerdere lanceringen in Parijs en Milaan.

Met de nieuwe regio in Berlijn wil OVHcloud inspelen op de groeiende vraag naar digitale soevereiniteit, beveiliging en veerkracht binnen de Europese markt.

Ander nieuws in de marge van OVHcloud Summit is de lancering van Quantum Platform. Hiermee krijg je cloudtoegang tot Europese kwantumsystemen. De eerste beschikbare processor is de Pasqal Orion Beta QPU van het Franse Pasqal. OVH wil via de dienst snel de acht meest geavanceerde kwantumcomputers van het moment aanbieden. Het platform moet organisaties helpen om use-cases te testen zonder eigen gespecialiseerde infrastructuur.