De wereld van generatieve AI (GenAI) evolueert snel, met steeds meer modellen die bedrijven kunnen gebruiken. Deze modellen zijn in twee hoofdcategorieën onder te verdelen, namelijk closed-source en open-source.
Closed-source gebaseerde modellen, zoals GPT-4o van OpenAI, Claude 3 van Anthropic of Google’s Gemini 1.5 Pro, worden ontwikkeld en beheerd door particuliere en publieke bedrijven. Deze staan bekend om hun geavanceerde prestaties en training op grote hoeveelheden data, maar hebben ook beperkingen op het gebied van maatwerk, beheer en kosten.
Anderzijds zijn modellen gebaseerd op open-source, zoals Llama 3 of Mistral, vrij beschikbaar om zakelijk te gebruiken en naar wens aan te passen. Deze modellen bieden meer flexibiliteit, transparantie en kosteneffectiviteit, in vergelijking met hun closed-source tegenhangers.
Voordelen en uitdagingen van closed-source modellen
Closed-source modellen zijn populair geworden door hun brede toepassingsmogelijkheden en het gebruiksgemak. Platformen zoals de API van OpenAI of Google Cloud AI bieden bedrijven toegang tot krachtige GenAI-modellen zonder dat er uitgebreide interne expertise nodig is. Deze modellen blinken uit in een breed scala aan taken, van het genereren van verschillende typen content tot automatische vertalingen.
Het gebruik van closed-source brengt echter ook uitdagingen met zich mee. Bedrijven hebben beperkte controle over de architectuur, trainingsdata en output van het model. Dit gebrek aan transparantie kan aanleiding geven tot zorgen over dataprivacy, security en vooringenomenheid. Bovendien kunnen de kosten voor deze modellen snel toenemen naarmate het gebruik groeit, waardoor het voor bedrijven moeilijk wordt om hun GenAI-applicaties snel op te schalen.
Opkomst van open-source: maatwerk, controle en kosteneffectiviteit
AI-modellen gebaseerd op open-source zijn een aantrekkelijk alternatief voor de meer gesloten modellen, waardoor het gebruik daarvan toeneemt. Volgens GitHub was er tussen 2022 en 2023 een stijging van 148% in individuele bijdragers en een stijging van 248% in het totale aantal open-source GenAI-projecten op GitHub. Bij AI gebaseerd op open-source kunnen bedrijven de modellen afstemmen op hun specifieke behoeften. Door ze te trainen op eigen data kan men ook maatwerk GenAI-applicaties creëren die aanzienlijk beter presteren dan generieke modellen gebaseerd op gesloten-source.
AI-modellen gebaseerd op open-source zijn een aantrekkelijk alternatief voor de meer gesloten modellen.
Rein de Jong, Regional Vice President BeNelux bij Cloudera.
Verder bieden AI-toepassingen gebaseerd op open-source bedrijven volledige controle over de implementatie en het gebruik van het model. Volgens data verzameld door Andreessen Horowitz (a16z) noemde 60% van de AI-verantwoordelijken controle als de belangrijkste reden om open source te gebruiken. Met die controle kunnen bedrijven de dataprivacy, -security en de naleving van regelgeving garanderen. Verder maken op open-source gebaseerde modellen ook serieuze kostenbesparingen mogelijk in vergelijking met gesloten-source, omdat deze modellen op de eigen infrastructuur zijn uit te voeren en te schalen, zonder buitensporige gebruikskosten.
De selectie van het juiste GenAI-model is afhankelijk van meerdere factoren, waaronder de toepassing zelf, beschikbare data, prestatie-eisen en het budget. Voor sommige toepassingen zijn modellen gebaseerd op closed-source mogelijk het meest geschikt, vanwege hun gebruiksgemak en prestaties. Voor organisaties die meer maatwerk, controle en beheersing van de kosten nodig hebben, hebben modellen gebaseerd op open-source meestal de voorkeur.
Cloudera’s benadering van modelflexibiliteit en -implementatie
Cloudera begrijpt het belang van flexibiliteit bij de keuze en implementatie van GenAI-modellen. Ons platform ondersteunt een breed scala aan zowel open-source als closed-source modellen, waardoor organisaties altijd het beste model voor hun specifieke behoeften kunnen kiezen.
Met Cloudera kunnen bedrijven ook eenvoudig AI-modellen gebaseerd op open-source trainen, verfijnen en implementeren op de eigen infrastructuur. Het platform biedt namelijk een veilige en beheerde omgeving voor modelontwikkeling, waardoor data-scientists en -engineers effectief kunnen samenwerken. Cloudera’s platform is tevens te integreren met open-source gebaseerde bibliotheken en frameworks, zoals TensorFlow en PyTorch, waardoor compatibiliteit met de nieuwste ontwikkelingen op het gebied van GenAI wordt gegarandeerd.
Voor bedrijven die liever closed-source modellen gebruiken, biedt het platform van Cloudera een naadloze integratie met de meest gebruikte publieke cloud AI-diensten, zoals Amazon Bedrock. Dankzij deze integratie kunnen organisaties de kracht van closed-source gebaseerde modellen benutten en toch de controle behouden over hun bedrijfsdata en de gebruikte infrastructuur.
Dit is een ingezonden bijdrage van Rein de Jong, Regional Vice President BeNelux bij Cloudera. De redactie is niet verantwoordelijk voor de inhoud.