Zum Inhalt springen
news · 3 min Lesezeit

OpenAI veröffentlicht GPT-5.5: Das agentischere Modell

OpenAI veröffentlicht GPT-5.5 mit 82,7 % auf Terminal-Bench 2.0, weniger Token-Verbrauch und besserer Agenten-Fähigkeit.

openai gpt-5.5 agentische ki llm

OpenAI hat am 23. April 2026 GPT-5.5 vorgestellt und rückt damit ein Modell ins Zentrum, das auf längere, werkzeuggestützte Abläufe zielt. Für Entwickler ist die eigentliche Nachricht weniger das Label als die operative Folge: Agenten-Workflows müssen schneller neu bewertet werden.

Denn das Releasetempo zieht weiter an. Wer auf OpenAI-Infrastruktur aufbaut, bekommt kürzere Migrationszyklen, engere Eval-Schleifen und weniger Ruhe zwischen zwei Modellgenerationen.

Mehr Leistung in agentischen Aufgaben

Nach Angaben von OpenAI legt GPT-5.5 vor allem dort zu, wo ein Modell nicht nur antworten, sondern Arbeit über mehrere Schritte organisieren soll. Auf Terminal-Bench 2.0 steigt der Wert von 75,1 auf 82,7 Prozent, die interne Expert-SWE-Evaluierung von 68,5 auf 73,1 Prozent. Bei GDPval gewinnt oder bindet das Modell in 84,9 Prozent der Fälle [1].

Wichtiger als die einzelnen Zahlen ist die Richtung dahinter. OpenAI beschreibt GPT-5.5 als vollständig neu trainiertes Modell für Aufgaben wie Code-Arbeit, Web-Recherche, Datenanalyse oder Softwarebedienung. Der Unterschied liegt damit nicht nur in besseren Einzelantworten, sondern in der Fähigkeit, Planung, Tool-Nutzung und Zwischenprüfungen robuster zusammenzuhalten.

Für Agenten-Builder zählt genau dieser Punkt im Alltag. Ein Modell ist nicht automatisch nützlicher, nur weil es in Benchmarks steigt. Es wird dann relevant, wenn es längere Abläufe sauberer durchzieht, ohne bei Umwegen oder Tool-Wechseln früh zu entgleisen.

Tempo und Token werden zum eigentlichen Hebel

OpenAI betont außerdem, dass die Pro-Token-Latenz im Vergleich zu GPT-5.4 stabil bleibt und GPT-5.5 bei Codex-Aufgaben weniger Tokens verbraucht [1]. Falls sich das im produktiven Einsatz bestätigt, ist das für viele Teams fast wichtiger als der Benchmark-Sprung selbst.

Autonomie ist in Agenten-Systemen nur dann ein Gewinn, wenn sie nicht sofort über Laufzeit und Kosten wieder verloren geht. Mehr eigenständige Schritte helfen wenig, wenn jeder Durchlauf langsamer, teurer oder schwerer kontrollierbar wird. GPT-5.5 zielt laut OpenAI genau auf diesen Engpass: mehr Ausdauer, ohne die Reibung im Betrieb hochzutreiben.

OpenAI baut das Modell als Plattformkern ein

OpenAI rahmt GPT-5.5 selbst als Schritt zu stärker agentischem und intuitiverem Computing. Wichtiger als diese Formulierung ist die Plattformlogik dahinter: Das Modell soll nicht bloß bessere Antworten liefern, sondern enger mit ChatGPT, Codex und browsernahen Workflows zusammenspielen.

Für Entwickler verschiebt sich damit der Fokus. Entscheidend ist weniger, ob eine einzelne Antwort eleganter ausfällt, sondern was bei längeren Abläufen unter Last passiert. Wenn Modell, Tool-Ausführung, Kontext und Kontrolle enger zusammenrücken, reicht Prompt-Tuning allein nicht mehr. Dann werden Evals, Abbruchregeln und Kostenlimits zum eigentlichen Migrationspaket.

Verfügbarkeit und die praktische Konsequenz

GPT-5.5 ist nach Angaben von OpenAI für Plus-, Pro-, Business- und Enterprise-Nutzer in ChatGPT und Codex verfügbar. Die Pro-Variante rollt für Pro-, Business- und Enterprise-Kunden aus, die API-Anbindung ist von OpenAI als nächster Schritt angekündigt [1].

Begleitend verweist OpenAI auf erweitertes Redteaming, Prüfungen für fortgeschrittene Cybersecurity- und Biologie-Fähigkeiten sowie Feedback von rund 200 Early-Access-Partnern [1]. Für das spätere API-Deployment erwartet das Unternehmen zusätzliche Sicherheits- und Infrastrukturanforderungen.

Für die Agenten-Landschaft ist das die eigentliche Botschaft dieses Releases. Die Grenze zwischen Antwort und Aktion verschiebt sich weiter. Wer produktive Agenten betreibt, kann Modellwechsel deshalb nicht mehr als gelegentliche Upgrades behandeln. Sie werden zum laufenden Betriebsprozess mit Evals, Tool-Grenzen, Kostenkontrolle und klaren Abbruchbedingungen. Genau deshalb lohnt auch der Blick auf frühere OpenAI-Bausteine wie die Sicherheitsarchitektur von Codex oder die Realtime-Voice-Modelle in der API: Die operative Frage ist nicht mehr nur, was ein Modell kann, sondern wie viele Systemteile beim nächsten Wechsel mitbewegt werden.

Transparenz

Agentenlog nutzt KI-Assistenz für Recherche, Struktur und Entwurf. Inhaltliche Auswahl, Einordnung und Veröffentlichung liegen redaktionell bei Agentenlog; Quellen und Fakten werden vor Veröffentlichung geprüft.