OpenAI hat heute zwei neue Modelle vorgestellt – o3 und o4-mini – und damit seine o-Serie deutlich erweitert. Diese Modelle wurden mit dem Ziel entwickelt, wie selbstständige Agenten zu denken, zu handeln und Probleme zu lösen. Sie versprechen, die Grenze zwischen digitalem Assistenten und fähigem Mitarbeiter verschwimmen zu lassen.
Doch hinter den tollen Benchmark-Zahlen und Demovideos verbirgt sich eine tiefergehende Geschichte über veränderte KI-Paradigmen, den Vorstoß in Richtung Tool-gestützte Intelligenz und die Spannung zwischen Leistung, Genauigkeit und Kosten.
OpenAI bezeichnet es als grundlegenden Fortschritt: o3 und o4-mini können jetzt selbstständig entscheiden, wie und wann sie Tools einsetzen – vom Ausführen von Code und Erstellen von Diagrammen bis zum Abrufen von Echtzeit-Webdaten und Analysieren von Bildern. Diese Fähigkeit ist keine oberflächliche Verbesserung. Es ist ein philosophischer Wendepunkt.
Anstatt einfach nur Fragen zu beantworten, gehen diese Modelle Aufgaben wie menschliche Analysten an: Sie zerlegen Probleme in Teile, wählen die richtigen Werkzeuge aus und fassen Informationen aus verschiedenen Formaten zusammen – und das alles selbstständig.
In einer Demonstration bearbeitete o3 eine komplexe Anfrage zum Energieverbrauch. Das Modell nutzte das Web, um Verbrauchsdaten zu finden, führte Python-Code aus, um sie zu analysieren, erstellte ein Diagramm und setzte die Ergebnisse in einen wirtschaftlichen Zusammenhang – alles innerhalb einer Minute. Das war keine einstudierte Inszenierung, sondern strategische Entscheidungsfindung.
„Die Bedeutung liegt nicht darin, dass es Tools verwendet hat“, bemerkte ein unabhängiger KI-Forscher. „Sondern darin, dass es wusste, wie man mit ihnen denkt. Das ist eine andere Art von Intelligenz.“
Ein weiterer Fortschritt: Diese Modelle verarbeiten Bilder nicht nur, sondern denken mit ihnen.
Als o3 mit einem Foto von auf dem Kopf stehender, unleserlicher Handschrift konfrontiert wurde, bat es nicht um Hilfe. Es zoomte hinein, drehte das Bild und transkribierte den Text korrekt. Es verstand nicht nur, was es sah, sondern auch, was es damit tun musste.
Diese Weiterentwicklung, die als "Denken mit Bildern" bezeichnet wird, markiert ein Zusammenwachsen von Modalitäten, das weit über die reine Computer Vision hinausgeht. Es deutet auf KI-Systeme hin, die in der Lage sind, Bilder als manipulierbare, kognitive Objekte zu behandeln – eine Fähigkeit, die lange Zeit als einzigartig menschlich galt.
Erste Tester weisen darauf hin, dass diese Fähigkeit vor allem in wissenschaftlichen und technischen Kontexten nützlich ist. In einem Fall war ein Prototyp in der Lage, ein unordentliches Foto eines Laborbuchs zu interpretieren und korrekte chemische Gleichungen aus handgeschriebenen Notizen abzuleiten, wobei sogar Anmerkungen in Diagrammen erkannt wurden.
Unter der Oberfläche verbirgt sich eine leistungsstarke Engine.
Das o3-Modell führt nun branchenweit Benchmarks in den Bereichen Mathematik, Programmierung, Softwareentwicklung und multimodales Denken an. Laut OpenAI macht es 20 % weniger schwerwiegende Fehler als sein Vorgänger, insbesondere in Bereichen wie Geschäftsstrategie, wissenschaftliche Hypothesenbildung und kreative Ideenfindung.
Unterdessen übertrifft o4-mini seine Erwartungen. Obwohl es sich um ein verkleinertes Modell handelt, das auf Geschwindigkeit und Kosten optimiert ist, erreichte es in Kombination mit Python eine Genauigkeit von 99,5 % beim AIME 2025-Benchmark. Für Entwickler, die täglich Tausende von Abfragen ausführen, ist das Preis-Leistungs-Verhältnis kaum zu überbieten.
„Man sieht Ergebnisse auf hohem Niveau bei branchenüblichen Aufgaben, von einem Modell, das halb so groß ist“, sagte ein Ingenieur eines Quant-Hedgefonds. „Das ist nicht nur Effizienz. Das ist eine Revolution.“
Was diese Generation auszeichnet, ist nicht nur ihre Leistungsfähigkeit, sondern auch der Zugang.
Mit der Integration von o4-mini in die kostenlose Version von ChatGPT und der Verfügbarkeit beider Modelle über API- und Desktop-Tools initiiert OpenAI einen Plattformwechsel. Codex CLI, ein schlanker, terminalbasierter Agent, der o3 zum Denken nutzt, ist Open Source und bereits auf GitHub verfügbar. Entwickler können Screenshots, Skizzen oder lokale Codebasen einfügen, und das Modell antwortet direkt in der Shell.
Damit positioniert sich OpenAI an der Spitze dessen, was Insider als "Agentic Interface War" bezeichnen: eine Verlagerung von Chat-basierten Assistenten hin zu Tools, die als selbstständige Mitarbeiter in Arbeitsabläufen agieren – sei es beim Debuggen von Code, beim Interpretieren von MRT-Scans oder beim Optimieren von Werbebudgets.
Der Schritt ist auch strategisch. Angesichts des bevorstehenden GPT-5 richtet das Unternehmen seine o-Serie auf kommende Modelle aus und verspricht eine engere Verzahnung zwischen tiefem Denken und natürlicher Konversation.
Doch auch wenn die Leistung steigt, bleiben Einschränkungen bestehen. Kleinere Modelle wie o4-mini zeigen eine schwächere Leistung bei Aufgaben zum Abrufen von Fakten, insbesondere in Bereichen wie historischem oder biografischem Wissen. Bei PersonQA-Bewertungen blieb o4-mini hinter früheren Modellen zurück, was wahrscheinlich auf eine geringere Anzahl von Parametern und eine stärkere Trainingskomprimierung zurückzuführen ist.
Eine weitere Herausforderung ist Übermut. Das o3-Modell ist zwar intelligenter, neigt aber dazu, mehr Behauptungen aufzustellen – sowohl richtige als auch falsche –, wenn Informationen unklar sind. Dies ist nicht nur ein Fehler, sondern ein Design-Dilemma. Je mehr Denkfähigkeit Modelle gewinnen, desto wahrscheinlicher ist es auch, dass sie komplexe Schlussfolgerungen ziehen, was das Risiko subtiler Halluzinationen erhöht.
„Es ist ein zweischneidiges Schwert“, erklärte ein Systemintegrator. „Je besser es denken kann, desto selbstbewusster wird es. Aber wenn Ihre Eingaben unsicher sind, könnten es Ihre Ausgaben auch sein. Das ist in regulierten Branchen ein großes Problem.“
Die Veröffentlichungsfrequenz ist hoch. o3, o4-mini und o4-mini-high sind bereits für zahlende ChatGPT-Nutzer mit Plus-, Pro- und Team-Plänen verfügbar. Nutzer der kostenlosen Version können o4-mini unter der Kategorie "Think" testen, während die Einführung in Unternehmen und Bildungseinrichtungen in Kürze erwartet wird.
Ein verbessertes o3-pro-Modell mit vollem Tool-Zugriff soll innerhalb weniger Wochen veröffentlicht werden. Entwickler haben über Chat Completions und die neue Responses API Zugriff, wobei für erweiterte Funktionen möglicherweise eine Verifizierung erforderlich ist.
OpenAI lockt auch mit Anreizen: Ein Zuschuss von 1 Million US-Dollar in API-Guthaben ist für Entwickler vorgesehen, die mit Codex CLI und Agentenfunktionen arbeiten.
Die Botschaft ist klar: Dies ist nicht nur ein Produktupdate. Es ist eine Plattform-Neuausrichtung auf multimodale, multi-tool-basierte und mehrstufige Intelligenz.
Für professionelle Nutzer – von Händlern und Analysten bis hin zu Ingenieuren und Beratern – sind die Auswirkungen tiefgreifend.
Während ältere Modelle als hochentwickelte Taschenrechner oder schnell sprechende Enzyklopädien dienten, nähert sich die o-Serie nun dem Verhalten von Nachwuchsanalysten an. Sie stellt Fragen, formuliert Hypothesen, wählt Werkzeuge aus und erklärt Ergebnisse. Das positioniert sie weniger als passive Ressource, sondern eher als aktiven Problemlöser.
Doch Profis sollten skeptisch bleiben. Die neuen Modelle sind an den Rändern noch brüchig und neigen zu Datenhalluzinationen und gelegentlichem Tool-Missbrauch. Die Kalibrierung des Selbstvertrauens bleibt eine große Herausforderung.
Dennoch ist die allgemeine Richtung unbestreitbar: OpenAI setzt auf Agenten – nicht nur auf intelligentere Modelle, sondern auf solche, die planen, sich anpassen und handeln können.
Und mit GPT-5 am Horizont werden o3 und o4-mini vielleicht nicht als Ende, sondern als Anfang in Erinnerung bleiben.
In einer KI-Landschaft, die von geringfügigen Verbesserungen und Hype-Zyklen überfüllt ist, fühlen sich o3 und o4-mini von OpenAI anders an. Sie antworten nicht nur. Sie handeln. Sie sehen nicht nur. Sie denken.
Zum ersten Mal ist künstliche Intelligenz nicht mehr nur ein Werkzeug im Werkzeugkasten. Sie ist der Kollege, der Ihnen den Schraubenschlüssel reicht.
Und das verändert alles.
Das könnte Ihnen auch gefallen
Dieser Artikel wurde von unserem Benutzer gemäß den Regeln und Richtlinien für die Einreichung von Nachrichten. Das Titelbild ist computererzeugte Kunst nur zu illustrativen Zwecken; nicht indikativ für den tatsächlichen Inhalt. Wenn Sie glauben, dass dieser Artikel gegen Urheberrechte verstößt, zögern Sie bitte nicht, dies zu melden, indem Sie uns eine E-Mail senden. Ihre Wachsamkeit und Zusammenarbeit sind unschätzbar, um eine respektvolle und rechtlich konforme Community aufrechtzuerhalten.
Abonnieren Sie unseren Newsletter
Erhalten Sie das Neueste aus dem Unternehmensgeschäft und der Technologie mit exklusiven Einblicken in unsere neuen Angebote
Wir verwenden Cookies auf unserer Website, um bestimmte Funktionen zu ermöglichen, Ihnen relevantere Informationen bereitzustellen und Ihr Erlebnis auf unserer Website zu optimieren. Weitere Informationen finden Sie in unserer Datenschutzrichtlinie und unseren Nutzungsbedingungen . Obligatorische Informationen finden Sie im Impressum