Der Grafikchip-Spezialist Nvidia hat seine eigene Familie von großen Sprachmodellen (LLMs) vorgestellt. NVLM 1.0, wie die Modellfamilie heißt, wird von einem 72B-Parametermodell namens NVLM-D 72B angeführt, das mit OpenAIs GPT-4o konkurrieren soll. Interessanterweise investiert Nvidia gleichzeitig direkt in OpenAI und unterstützt damit seinen neuen Konkurrenten.
Nvidia stellt NVLM als Open Source zur Verfügung. Sowohl die Gewichte als auch der Trainingscode werden über Megatron-Core, Nvidias Open-Source-Bibliothek, bereitgestellt. In Benchmarks, deren Ergebnisse Nvidia in einem Blogbeitrag veröffentlichte, schnitt NVLM-D 72B durchweg ähnlich gut ab wie aktuelle Versionen von Metas Open-Source-Modell Llama sowie die proprietären Modelle OpenAI GPT-4o, Anthropic Claude und Google Gemini. "Die Ergebnisse zeigen, dass NVLM 1.0 sowohl bei Bild- als auch bei reinen Textaufgaben eine Leistung erzielt, die mit der führender Modelle vergleichbar ist", so Nvidia. Bei mathematischen Aufgaben übertraf das Modell GPT-4o sogar teilweise. Bemerkenswert ist auch, dass NVLM-D 72B seine Leistung bei reinen Textaufgaben nach dem multimodalen Training beibehielt oder sogar verbesserte, ein häufiges Problem bei multimodalen Modellen.
Nvidia hebt die Fähigkeit des Modells hervor, Anweisungen präzise zu befolgen und "hochwertige, detaillierte Beschreibungen eines vorgegebenen Bildes" zu generieren.
Nvidias Investition in OpenAI, die sich auf rund 100 Millionen US-Dollar beläuft, ist Teil einer größeren Finanzierungsrunde, in der OpenAI insgesamt 6,6 Milliarden US-Dollar einsammelte. Angeführt wird die Finanzierung von Thrive Capital, einem New Yorker Risikokapitalgeber. Microsoft beteiligt sich ebenfalls mit rund einer Milliarde US-Dollar. Im Gegenzug für die Investitionen fordern die Geldgeber, dass OpenAI seine nicht-kommerzielle Struktur zugunsten eines gewinnorientierten Modells aufgibt. Die finanzielle Situation von OpenAI bleibt angespannt, da die Ausgaben die Einnahmen übersteigen.
Neben Nvidia setzt vor allem Meta auf Open Source für seine KI-Modelle. Mark Zuckerberg, CEO von Meta, betont die Bedeutung von Open Source für die Weiterentwicklung der KI und die Entstehung eines florierenden Ökosystems. Mit Nvidia betritt nun ein gewichtiger Konkurrent den KI-Open-Source-Markt. Zuckerberg argumentiert, dass Meta es sich leisten könne, seine Modelle frei zugänglich zu machen, da das Unternehmen über andere Einnahmequellen verfüge. Dasselbe gilt für Nvidia, das mit seinen KI-Chips hohe Gewinne erzielt. Letztendlich profitiert Nvidia auch dann, wenn OpenAI seinen Bedarf an diesen Chips erhöht.
Nvidias Entscheidung, sowohl in OpenAI zu investieren als auch ein eigenes, konkurrierendes KI-Modell zu veröffentlichen, unterstreicht die strategische Bedeutung des Open-Source-Ansatzes in der KI-Entwicklung. Der Schritt dürfte den Wettbewerb im Bereich der großen Sprachmodelle weiter anheizen und zu Innovationen führen. Es bleibt abzuwarten, wie sich die Dynamik zwischen Nvidia und OpenAI entwickeln wird und welche Auswirkungen dies auf die zukünftige KI-Landschaft haben wird.