OpenAI maakt zijn nieuwe beeldengenerator Dall-E 3 breed beschikbaar via ChatGPT. De AI kan mooiere en gedetailleerdere beelden genereren dan zijn voorganger.
OpenAI maakt Dall-E 3 beschikbaar voor een breder publiek. Het AI-model verschijnt in ChatGPT, al kunnen alleen betalende gebruikers er op dit moment mee aan de slag. Je moet een abonnement hebben op ChatGPT Plus of ChatGPT Enterprise.
Dall-E 3 is een beeldengenerator op basis van generatieve AI. Met de aanvankelijke introductie van Dall-E imponeerde OpenAI de wereld, nog voor ChatGPT enkele maanden later echt de kaarten door elkaar zou schudden. Dall-E 3 begrijpt net als zijn voorgangers beschrijvingen van afbeeldingen en genereert op basis daarvan prenten. OpenAI lanceerde de beeldengenerator vorige maand.
Verbeteringen en beperkingen
De resolutie van die beelden blijft ook bij deze derde versie van de AI beperkt tot 1.024 x 1.024 pixels. Andere zaken zijn wel verbeterd. Zo begrijpt Dall-E 3 complexere vragen en krijgen de beelden meer details. Zeker met lichaamsdelen van mensen of dieren had Dall-E 2 wel wat problemen. Daar kan deze derde versie een stuk beter mee overweg.
Alle beelden die je met Dall-E 3 via ChatGPT genereert, zijn voor publiek gebruik. Je mag er dus mee doen wat je wil. Verder maakt OpenAI zich sterk dat het betere bescherming heeft ingebouwd tegen schadelijke content. Op het vlak van copyrightbescherming doet OpenAI een toegift door het onmogelijk te maken om te vragen naar een beeld in de stijl van een nog levende kunstenaar.
Aan de slag
Om met Dall-E 3 aan de slag te gaan, selecteer je de beeldengenerator bovenaan wanneer je een nieuw chatgesprek start.
Vervolgens kan je je verbeelding de vrije loop laten. Wees erg specifiek: één van de kwaliteiten van Dall-E 3 is precies dat het met gedetailleerde en concrete prompts overweg kan. Aarzel dus niet om in veel detail te omschrijven wat je wil. ChatGPT begrijpt Nederlands, maar de prompts worden voor Dall-E wel vertaald naar het Engels.
Tijdens onze tests zien we veel beterschap, al zijn de beelden nog steeds niet perfect. Voeten en trappen zijn een uitdaging, en we vragen ons af waar het tweede been van de dame aan de linkerkant is. Toch zijn gezichten, armen en zelfs handen een stuk realistischer dan bij eerdere iteraties. Voor deze prent vroegen we een beeld van een mens met het gezicht van een kat op de trap in de metro van Londen.
In deze tweede prent vroegen we specifiek naar een mime-optreden van een kat-mens met applaudisserende toeschouwers, in een zonnige straat in Parijs. Ook hier heeft de occasionele enkeling zijn hand een beetje verstuikt, maar ziet alles er toch een stuk realistischer uit. Klik je op een afbeelding, dan zie je meteen een omschrijving van Dall-E 3 zelf, die als een soort verantwoording dient voor het werk en de relatie ervan tot je prompt.
Tot slot gingen we voor sfeer. Opnieuw staat een kat centraal. Deze keer moest ze vuurspuwen bovenop een gebouw in New York terwijl het regende in de nacht. Let op de details zoals de reflectie van de vlam op kat en gebouw.
Dall-E 3 is maar pas beschikbaar en wij zijn niet de enige die het model even wilden proberen. Het duurt dus wel even voor de beeldengenerator je prompt omzet in een prent. Tijdens onze tests moesten we toch zeker een half minuutje wachten. Bovendien lukt het ons niet altijd meteen om een afbeelding te downloaden via de knop bovenaan.