OpenAI hat kürzlich zwei neue Modelle, o1-preview und o1-mini, vorgestellt. Diese Modelle zielen darauf ab, die Fähigkeiten von Künstlicher Intelligenz (KI) in den Bereichen Wissenschaft, Mathematik und Programmierung deutlich zu verbessern. Diese Ankündigung hat die Technologiebranche in Aufregung versetzt, da die neuen Modelle in der Chatbot-Arena beeindruckende Leistungen gezeigt haben.
Das o1-preview-Modell hat es geschafft, in allen bewerteten Kategorien den ersten Platz zu belegen. Dazu gehören die allgemeine Leistung, Sicherheit und technische Fähigkeiten. Das o1-mini-Modell, das auf MINT-Aufgaben (Mathematik, Informatik, Naturwissenschaften und Technik) spezialisiert ist, teilte sich zeitweise den zweiten Platz mit einer Version von GPT-4o, die Anfang September veröffentlicht wurde. Insbesondere in technischen Bereichen hat o1-mini die Führung übernommen.
Die Leistungsbewertung der neuen OpenAI-Modelle wurde auf der Grundlage von über 6.000 Community-Bewertungen durchgeführt. Diese Bewertungen zeigen, dass o1-preview und o1-mini besonders gut bei mathematischen Aufgaben, komplexen Aufforderungen und Programmieraufgaben abschneiden. Es ist jedoch wichtig zu beachten, dass diese neuen Modelle deutlich weniger Bewertungen erhalten haben als etablierte Systeme wie GPT-4o oder Claude 3.5. Dies könnte die Aussagekraft der Ergebnisse einschränken und zu Verzerrungen führen.
Die neuen o1-Modelle von OpenAI setzen einen neuen Standard für KI-Denken, indem sie länger „nachdenken“, bevor sie antworten. Diese verlängerte Denkzeit ermöglicht es dem Modell, komplexere Aufgaben zu bewältigen. In Bereichen, die keine komplexe logische Überlegung erfordern, kann jedoch eine schnelle Antwort von GPT-4o ausreichend sein.
Ein Diagramm von Lmsys zeigt deutlich, dass o1-preview und o1-mini in Mathematik über 1360 Punkte erreichen, was weit über der Leistung anderer Modelle liegt.
Die o1-Modelle zeichnen sich nicht nur durch ihre Leistungsfähigkeit aus, sondern auch durch ihre verbesserten Sicherheitsmerkmale. OpenAI hat Sicherheitsregeln direkt in den Denkprozess des Modells eingebettet, was zu einer höheren Widerstandsfähigkeit gegen Sicherheitslücken führt. Dies wird durch umfassende Tests und Zusammenarbeit mit Sicherheitseinrichtungen in den USA und Großbritannien unterstützt.
Die o1-Modelle sind für komplexe Problemlösungen in den Bereichen Wissenschaft, Programmierung und Mathematik konzipiert. Mögliche Anwendungen umfassen die Annotation von Zellsequenzierungsdaten, die Erstellung mathematischer Formeln für die Quantenoptik und die Durchführung mehrstufiger Arbeitsabläufe in der Entwicklung.
Das o1-mini-Modell bietet eine kosteneffiziente Alternative und ist für Anwendungen konzipiert, die fokussiertes Denken erfordern, ohne umfangreiches Weltwissen.
ChatGPT Plus und Team-Nutzer haben ab sofort Zugang zu beiden Modellen. Enterprise- und Edu-Nutzer erhalten nächste Woche Zugang. API-Nutzer der Stufe 5 können ebenfalls ab heute beide Modelle nutzen, jedoch mit einer Rate von 20 RPM. Die API unterstützt derzeit einige Funktionen wie das Aufrufen von Funktionen und Streaming nicht, diese werden jedoch in zukünftigen Updates hinzugefügt.
OpenAI plant, das o1-mini-Modell auch für ChatGPT Free-Nutzer zugänglich zu machen. Es wird zu einem Preis angeboten, der 80 % niedriger ist als der von o1-preview.
Während o1-mini in MINT-Bereichen hervorragende Leistungen erbringt, ist sein Faktenwissen in nicht-MINT-Bereichen im Vergleich zu größeren Modellen wie GPT-4o begrenzt. OpenAI plant, diese Einschränkungen in zukünftigen Updates zu beheben und das Modell auf andere Domänen auszudehnen.
OpenAI's neue Modelle, o1-preview und o1-mini, haben sich in der Chatbot-Arena als führend etabliert. Trotz der beeindruckenden Leistungen ist die geringe Anzahl an Bewertungen im Vergleich zu etablierten Modellen ein Faktor, der die Aussagekraft der Ergebnisse beeinflussen könnte. Zukünftige Entwicklungen werden zeigen, wie sich diese neuen Modelle weiterentwickeln und ihre Fähigkeiten ausbauen werden.