OpenAI lanceert nieuwe tools voor ontwikkeling van AI agents

OpenAI lanceert nieuwe tools voor ontwikkeling van AI agents

OpenAI introduceert vandaag een reeks nieuwe tools en API's waarmee ontwikkelaars en bedrijven eenvoudiger betrouwbare AI agents kunnen bouwen. De update omvat onder meer een nieuwe Responses API, ingebouwde zoekfuncties en een software development kit specifiek voor AI agents.

OpenAI zet een belangrijke stap in de ontwikkeling van zelfstandig opererende AI systemen met de lancering van nieuwe ontwikkeltools. Het techbedrijf heeft het afgelopen jaar verschillende verbeteringen doorgevoerd in hun modellen, waaronder geavanceerde redeneercapaciteiten en multimodale interacties. Klanten gaven echter aan dat het nog steeds uitdagend was om deze mogelijkheden om te zetten in praktisch bruikbare agents.

Om deze uitdagingen aan te pakken introduceert OpenAI nu een nieuwe Responses API die de eenvoud van de Chat Completions API combineert met de toolmogelijkheden van de Assistants API. De nieuwe API wordt geleverd met ingebouwde functionaliteiten voor webzoeken, bestandszoeken en computergebruik.

Daarnaast lanceert het bedrijf een nieuwe Agents SDK voor het orchestreren van workflows met één of meerdere AI agents. Deze komt met geïntegreerde observatietools om de werking van agents te kunnen volgen en analyseren.

Een belangrijke nieuwe functie is de webzoekfunctionaliteit, waarmee ontwikkelaars actuele informatie kunnen ophalen met duidelijke bronvermelding. Deze functie is beschikbaar in de modellen gpt-4o en gpt-4o-mini. Uit tests blijkt dat deze modellen respectievelijk 90% en 88% scoren op de SimpleQA benchmark voor het beantwoorden van feitelijke vragen.

De verbeterde bestandszoekfunctie stelt ontwikkelaars in staat om relevante informatie op te halen uit grote hoeveelheden documenten. Het systeem ondersteunt verschillende bestandsformaten en biedt mogelijkheden voor het filteren van metadata en aangepaste rangschikking van zoekresultaten. De kosten bedragen $2,50 per duizend zoekopdrachten en $0,10 per GB per dag voor bestandsopslag, waarbij de eerste GB gratis is.

Voor het automatiseren van computertaken introduceert OpenAI de computer use tool, aangedreven door hetzelfde Computer Using Agent (CUA) model dat wordt gebruikt in Operator. Dit onderzoeksmodel heeft nieuwe records gezet met een succespercentage van 38,1% op OSWorld voor algemene computertaken, 58,1% op WebArena en 87% op WebVoyager voor webbased interacties.

Bedrijven als Unify en Luminai maken al gebruik van deze nieuwe mogelijkheden. Zo gebruikt Unify de computergebruikstool om informatie te verzamelen die voorheen niet via API's toegankelijk was, zoals het verifiëren van bedrijfsuitbreidingen via online kaarten. Luminai past de tool toe om complexe operationele workflows te automatiseren voor grote ondernemingen met verouderde systemen.

OpenAI benadrukt dat er uitgebreide veiligheidstests zijn uitgevoerd voordat deze functies werden vrijgegeven. Er zijn verschillende beveiligingsmaatregelen ingebouwd, waaronder controles tegen prompt injecties en bevestigingsprompts voor gevoelige taken. Het bedrijf waarschuwt wel dat het model nog steeds fouten kan maken, vooral in niet-browser omgevingen, en adviseert menselijk toezicht in deze scenario's.

De nieuwe Agents SDK, die open source beschikbaar is, biedt verbeteringen ten opzichte van het experimentele Swarm platform dat vorig jaar werd uitgebracht. Ontwikkelaars kunnen hiermee eenvoudig AI agents configureren, overdrachten tussen agents regelen en veiligheidscontroles instellen. Het systeem biedt ook uitgebreide mogelijkheden voor het volgen en optimaliseren van de prestaties.

OpenAI verwacht dat AI agents een steeds belangrijkere rol gaan spelen in het bedrijfsleven. Het bedrijf blijft investeren in verdere integraties en nieuwe tools om ontwikkelaars en bedrijven te helpen bij het bouwen en optimaliseren van betrouwbare AI systemen.

Probeer het nu zelf in OpenAI's playground.

🎤 Robin