OpenAI heeft een nieuwe AI-beeldgenerator gelanceerd. Is ChatGPT Images 2.0 werkelijk beter dan zijn voorganger, en hoe presteert het model ten opzichte van Googles Nano Banana 2?
Dinsdag heeft OpenAI ChatGPT Images 2.0 onthuld. Dit is de nieuwste versie van het beeldgeneratiemodel en volgt Image 1.5 op. We namen Images 2.0 eerder al uitgebreid onder de loep, maar hoe goed is het nu werkelijk in de praktijk?
We onderwerpen ChatGPT Images 2.0 aan vijf testen, en vergelijken met zijn voorganger en het Nano Banana 2-model van Google. Hiervoor maken we gebruik van de API-versies van de modellen.
ChatGPT Images 2.0 vs Image 1.5 vs Google Nano Banana 2
Test 1: realistische foto
In de eerste test vragen we de modellen om een zo realistisch mogelijke foto te maken van een Belgisch icoon: het Atomium. OpenAI beweert namelijk dat zijn nieuwste beelden model de echte wereld zo goed kan vastleggen, dat je bijna niet meer ziet dat het om een AI-beeld gaat. Als extra moeilijkheid vragen we om de stijl van een analoge camera na te bootsen.
Dit is de exacte prompt: “Maak een realistische foto van het Atomium in Brussel bij zonsondergang, boots de stijl van een analoge camera na.” Klik op de beelden om ze in hun volle resolutie te bekijken.



De opdracht was een realistische foto maken, en dit doet ChatGPT Images 2 naar ons gevoel het beste. Dit zou op het eerste zicht een foto kunnen zijn die je van het Atomium neemt. Nano Banana maakt het meest scherpe beeld, maar het voelt, mede door de toevoeging van een Belgische vlag op de voorgrond, net iets te ‘afgeborsteld’.
Image 1.5 gaat als enige vol voor de retrolook. Prachtig vanuit esthetisch oogpunt, maar het model moet dringend meer foto’s van het Atomium bekijken. Het foto voegt een vijver toe die er in werkelijkheid niet is.
Test 2: infografiek
Eén van de nieuwe capaciteiten waarin ChatGPT Images 2 zich zou moeten onderscheiden, is de mogelijkheid om tekst toe te voegen aan beeld. Met het model zou je uitgebreide infografieken en slides moeten kunnen maken. We vragen de modellen om een infografiek over reuzenpanda’s te maken. Het gaat in deze opdracht om de combinatie van juiste en volledige informatie te brengen in een template dat visueel mooi en overzichtelijk is
Prompt: Maak een infografiek over reuzenpanda’s. Kies een visuele stijl die past bij het onderwerp. Klik op de beelden om ze in hun volle resolutie te bekijken.



Het contrast tussen Images 2.0 en Image 1.5 is duidelijk zichtbaar. Niet alleen oogt de infografiek van Imagen 2 visueel veel professioneler, het beeld bevat ook veel informatie die vlot leesbaar en gestructureerd is. Het Imagen 1.5-model slaagt er niet in tekst te verwerken en laat de dieren eruit zien alsof ze uit een kinderboek komen.
Nano Banana 2 komt aardig in de buurt van Images 2.0: de infografiek is ordelijk en gestructureerd en ieder visueel element heeft een meerwaarde. Het laat zich op slechts één foutje in de tekst betrappen.
Test 3: stripverhaal
Het vermogen om meer tekst te verwerken, zou je in staat moeten stellen om zelfs stripverhalen te maken met Images 2, en dat in verschillende talen. In de derde test laten we de modellen een korte strip tekenen. De modellen mogen zelf een verhaallijn en tekenstijl bepalen.
Prompt: “Maak een stripverhaal met een hond, kat en eend in een kantooromgeving. De hond spreekt Nederlands, de kat Engels en de eend Koreaans. De strip moet vier panelen tellen.”



De drie stripverhalen zijn amusant om te lezen en de sequentie van tekeningen volgen elkaar logisch op. Onze kennis van het Koreaans is net iets te beperkt om de grammaticale correctheid van de tekst te controleren (wie een fout opmerkt, mag het ons melden). Het gaat in deze test om details en Nano Banana 2 behoudt net iets meer consistentie in de ruimte en de kledij van de personages doorheen het verhaal.
Nek-aan-nek
ChatGPT Images 2.0 is een duidelijke sprong vooruit ten opzichte van zijn voorganger, zeker bij complexere visuals waarbij ook veel tekst aan de pas komt. De verschillen met Google Nano Banana 2 zijn veel minder uitgesproken.
In twee van de drie tests kwam het nieuwste model van OpenAI er nipt als winnaar uit, maar het lag echt aan details, en met een andere prompt zou je misschien een ander resultaat bekomen hebben. Over smaken en kleuren valt niet te twisten. De conclusie is dat er vandaag veel keuze is voor wie hoogstaande beelden wil genereren.
Brengen we economische motieven in rekening mee, dan biedt Googles model de beste prijs-kwaliteitverhouding. De kosten van de API liggen per gegeneerd beeld 2 eurocent lager. Op een paar beelden is dat een minimale besparing, maar op lange termijn kan het een slok op de borrel schelen.
