OpenAI introduceert nieuwe afbeelding generator in ChatGPT
OpenAI heeft vandaag een geavanceerde afbeelding generator geïntegreerd in GPT-4o, waarmee gebruikers nauwkeurige en fotorealistische afbeeldingen kunnen maken. De nieuwe functie is direct beschikbaar voor ChatGPT gebruikers.
OpenAI heeft een belangrijke stap gezet in de ontwikkeling van kunstmatige intelligentie door beeldgeneratie een kernfunctie te maken van hun taalmodellen. De nieuwe beeldgenerator, die is ingebouwd in GPT-4o, creëert niet alleen esthetisch aantrekkelijke afbeeldingen, maar legt ook de nadruk op praktische toepasbaarheid.
Alhoewel huidige AI modellen indrukwekkende kunstzinnige beelden kunnen maken, worstelen ze vaak met alledaagse visualisaties die mensen gebruiken om informatie te delen en kennis over te dragen. Van logo's tot diagrammen kunnen afbeeldingen exacte betekenis overbrengen wanneer ze worden gecombineerd met symbolen die verwijzen naar gedeelde taal en ervaring.
De nieuwe beeldgenerator in GPT-4o blinkt uit in het nauwkeurig weergeven van tekst, het precies volgen van instructies en het benutten van de ingebouwde kennisbank. Het systeem kan ook geüploade afbeeldingen analyseren en gebruiken als visuele inspiratie. Deze mogelijkheden maken het eenvoudiger om exact de gewenste afbeelding te creëren, waardoor beeldgeneratie een praktisch hulpmiddel wordt met precisie en kracht.

De technologie is vanaf vandaag beschikbaar voor Plus, Pro, Team en gratis gebruikers als de standaard beeldgenerator in ChatGPT. Enterprise en Edu gebruikers krijgen binnenkort ook toegang. Het systeem is tevens te gebruiken in Sora. Voor liefhebbers van DALL E blijft deze beschikbaar via een speciale DALL E GPT.
Ontwikkelaars kunnen binnen enkele weken afbeeldingen genereren met GPT-4o via de API. Het maken en aanpassen van afbeeldingen werkt eenvoudig door te chatten met GPT-4o. Gebruikers kunnen specifieke wensen aangeven, zoals beeldverhouding, exacte kleuren via hex codes of een transparante achtergrond. Omdat het model gedetailleerdere afbeeldingen maakt, duurt het genereren langer, vaak tot een minuut.

OpenAI erkent dat het systeem nog beperkingen kent. Zo kan het model lange afbeeldingen zoals posters soms te krap afsnijden, vooral aan de onderkant. Net als andere taalmodellen kan de beeldgenerator ook informatie verzinnen, vooral bij opdrachten met weinig context. Bij het genereren van afbeeldingen die een beroep doen op de kennisbank, kan het systeem moeite hebben met meer dan tien tot twintig verschillende concepten tegelijk. Ook worstelt het soms met niet-Latijnse talen en zijn de karakters niet altijd accuraat.
Om de veiligheid te waarborgen worden alle gegenereerde afbeeldingen voorzien van C2PA metadata die aangeeft dat ze door GPT-4o zijn gemaakt. Er is ook een intern zoeksysteem ontwikkeld om te verifiëren of content van hun model afkomstig is. Het bedrijf blijft verzoeken blokkeren voor afbeeldingen die hun inhoudsbeleid schenden, zoals kindermisbruik en seksuele deepfakes. Bij afbeeldingen van echte personen gelden strengere beperkingen rond naaktheid en grafisch geweld.
OpenAI benadrukt dat veiligheid een doorlopend aandachtspunt blijft waarop ze hun beleid zullen blijven aanpassen naarmate ze meer leren over het praktische gebruik van het model. Voor meer informatie over hun aanpak verwijzen ze naar de beeldgeneratie aanvulling op de GPT-4o systeemkaart.