Google laat Gemini opnieuw beelden van mensen maken

google gemini

Google herstelt de functie in Gemini om AI-beelden van mensen te genereren, nadat de functie tijdelijk was afgesloten wegens inaccurate beelden.

Google laat weer toe om met Gemini AI-beelden met mensen te maken. Dat bevestigt het bedrijf in een blog. Het heropent de functie wel op kleine schaal: enkel bedrijven en betalende Engelstalige gebruikers kunnen er vanaf vandaag al mee aan de slag.

De beeldgenerator in Gemini zorgde in februari voor heel wat ophef. Het Imagen-model, de tegenhanger van OpenAI’s DALL-E, produceerde beelden van mensen die historisch niet accuraat zijn. Op de vraag om “een Duitse soldaat uit 1943” te genereren, werd een zwarte man en Aziatische vrouw voorgesteld, een gegenereerde afbeelding van de Amerikaanse Founding Fathers liet zwarte mannen zien en een afbeelding van de oprichters van Google kreeg een Aziatisch tintje, om maar enkele voorbeelden van de blunders die Gemini maakte op te noemen.

Google had het Imagen-model bewust getraind met diversiteit in gedachten, om te vermijden dat beelden ‘een bereik van mensen’ zouden weerspiegelen. Het model trok die diversiteit echter ook door naar beelden waar dat in een specifieke culturele of historische context totaal niet gepast was. Google schortte het vermogen om beelden van mensen te genereren tijdelijk op en excuseerde zich publiekelijk.

Leren uit fouten

Om te vermijden dat het bij de tweede poging opnieuw fout gaat, zegt Google technische verbeteringen te hebben aangebracht. Er worden ook beperkingen ingevoerd. Zo zal Gemini niet ingaan op verzoeken om echte personen na te bootsen of expliciete gewelddadige of seksuele beelden met mensen op te maken. Google waarschuwt dat ondanks die correcties de tool nog niet perfect zal zijn.

lees ook

AI-zoekmachine geeft vreemde antwoorden, maar dat is ‘normaal’ volgens Google

Google geeft het model achter de beeldgeneratiefuncties een upgrade. Imagen 2 maakt plaats voor Imagen 3. Het nieuwe model levert een hogere beeldkwaliteit af en kan ook meerdere kunst- en fotostijlen aanleren.

imagen 3
Imagen 2 vs Imagen 3. Bron: Google

Google lanceert vandaag ook Gems, aangepaste versies van de Gemini-chatbot. De functie is beschikbaar voor betalende gebruikers.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.
terug naar home