Neue Entwicklungen im Bereich der Künstlichen Intelligenz: NVIDIA präsentiert Nemotron-Cascade 2

Kategorien:

No items found.

Freigegeben:

March 21, 2026

kostenlos testen Termin buchen

KI sauber im Unternehmen integrieren: Der 5-Schritte-Plan

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg

🎯

Strategie & Zieldefinition

Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.

✓ Messbare KPIs definiert

🛡️

Daten & DSGVO-Compliance

Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.

✓ 100% DSGVO-konform

⚙️

Technologie- & Tool-Auswahl

Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.

✓ Beste Lösung für Ihren Fall

🚀

Pilotprojekt & Integration

Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.

✓ Ergebnisse in 4-6 Wochen

👥

Skalierung & Team-Schulung

Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.

✓ Ihr Team wird KI-fit

Lassen Sie uns Ihren ersten Schritt planen

Inhaltsverzeichnis

mindverse studio – Ihre Plattform für digitale Effizienz

‍Optimieren Sie Prozesse, automatisieren Sie Workflows und fördern Sie Zusammenarbeit – alles an einem Ort.

Mehr über Mindverse Studio erfahren

Das Wichtigste in Kürze

NVIDIA hat Nemotron-Cascade 2, ein 30B Mixture-of-Experts (MoE) Modell mit 3 Milliarden aktivierten Parametern, veröffentlicht.
Das Modell zeigt herausragende Fähigkeiten im mathematischen und programmierbezogenen Denken und erreicht Goldmedaillen-Niveau bei internationalen Olympiaden.
Nemotron-Cascade 2 nutzt ein erweitertes Cascade RL (Reinforcement Learning)-Framework und Multi-Domain On-Policy Distillation.
Es kann sowohl im "Denkmodus" (Thinking Mode) als auch im "Anweisungsmodus" (Instruct Mode) betrieben werden.
Die Veröffentlichung auf Hugging Face umfasst Modell-Checkpoints und Trainingsdaten, die für Forschungs- und Entwicklungszwecke zugänglich sind.

Die Landschaft der Künstlichen Intelligenz (KI) wird kontinuierlich durch innovative Entwicklungen geprägt. Jüngst hat NVIDIA mit der Veröffentlichung von Nemotron-Cascade 2 auf Hugging Face eine bedeutende Neuerung im Bereich der großen Sprachmodelle (LLMs) vorgestellt. Dieses Modell, ein 30B Mixture-of-Experts (MoE) mit 3 Milliarden aktivierten Parametern, markiert einen Fortschritt in der Effizienz und Leistungsfähigkeit von KI-Modellen, insbesondere in anspruchsvollen Denk- und Agentenaufgaben.

Nemotron-Cascade 2: Eine detaillierte Betrachtung

Nemotron-Cascade 2 ist aus dem vorab trainierten Nemotron-3-Nano-30B-A3B-Basismodell hervorgegangen und wurde durch ein Post-Training weiterentwickelt. Die Architektur als MoE-Modell ermöglicht es, mit einer vergleichsweise geringen Anzahl von aktivierten Parametern hohe Leistungsniveaus zu erreichen. Dies deutet auf eine hohe "Intelligenzdichte" hin, bei der komplexe Aufgaben mit weniger Rechenressourcen bewältigt werden können.

Architektur und technische Innovationen

Das Kernstück der Innovationen von Nemotron-Cascade 2 liegt in seinem erweiterten Cascade RL-Framework und der Einführung der Multi-Domain On-Policy Distillation. Im Gegensatz zu früheren Ansätzen, die heterogene Prompts aus verschiedenen Domänen mischten, strukturiert Cascade RL das verstärkende Lernen sequenziell und domänenweise. Dies reduziert die technische Komplexität und führt zu einer überlegenen Leistung über eine breite Palette von Benchmarks.

Ein wesentlicher Unterschied zum Vorgängermodell Nemotron-Cascade 1 ist die erhebliche Ausweitung von Cascade RL auf ein breiteres Spektrum von Denk- und Agentendomänen. Zusätzlich ermöglicht die Multi-Domain On-Policy Distillation, Wissen von den stärksten Zwischen-Lehrermodellen für jede Domäne während des gesamten Cascade RL-Prozesses zu destillieren. Dies trägt dazu bei, Leistungsrückgänge effizient auszugleichen und gleichzeitig starke Leistungsgewinne aufrechtzuerhalten.

Leistungsfähigkeit und Benchmark-Ergebnisse

Die Leistungsfähigkeit von Nemotron-Cascade 2 wird durch beeindruckende Ergebnisse in verschiedenen Benchmarks unterstrichen. Insbesondere erreichte das Modell Goldmedaillen-Niveau bei der International Mathematical Olympiad (IMO) 2025 und der International Olympiad in Informatics (IOI) 2025. Diese Erfolge sind bemerkenswert, da sie eine hohe Problemlösungskompetenz in komplexen mathematischen und algorithmischen Aufgaben demonstrieren.

Im Vergleich zu anderen führenden offenen Modellen wie Qwen3.5-35B-A3B und dem größeren Nemotron-3-Super-120B-A12B übertrifft Nemotron-Cascade 2 diese in Schlüsselbereichen wie Mathematik, Code-Reasoning, Alignment und der Befolgung von Anweisungen. Dies gilt trotz seiner kompakteren Größe, was die Effizienz der angewandten Trainingsmethoden hervorhebt.

Einige ausgewählte Benchmark-Ergebnisse (Pass@1):

- IMO 2025: 🏅 35 Punkte - IOI 2025: 🏅 439.3 Punkte - AIME 2025: 92.4 - LiveCodeBench v6 (2408-2505): 87.2 - ArenaHard v2 (Avg.): 83.5

Betriebsmodi und Anwendungsflexibilität

Nemotron-Cascade 2 ist darauf ausgelegt, in zwei Hauptmodi zu operieren: einem "Denkmodus" und einem "Anweisungsmodus". Im Denkmodus generiert das Modell ausführliche Denkprozesse, bevor es eine endgültige Antwort liefert. Dies ist besonders nützlich für komplexe Aufgaben, die eine schrittweise Problemlösung erfordern. Im Anweisungsmodus hingegen liefert das Modell direkte Antworten, ohne die internen Denkprozesse offenzulegen.

Die Möglichkeit, zwischen diesen Modi zu wechseln, wird durch ein spezifisches Chat-Template ermöglicht, das tags wie <think> und </think> verwendet. Für den Anweisungsmodus wird ein spezieller Präfix <no_think> verwendet. Dies bietet Anwendern eine flexible Kontrolle über das Verhalten des Modells, je nach den Anforderungen der jeweiligen Aufgabe.

Zudem unterstützt Nemotron-Cascade 2 die Integration von Tools, wobei Werkzeugantworten unter der Rolle des "Benutzers" platziert und mit spezifischen Tags umschlossen werden. Dies ermöglicht es dem Modell, externe Funktionen oder APIs zu nutzen, um seine Fähigkeiten zu erweitern.

Open Source und Zugänglichkeit

NVIDIA hat Nemotron-Cascade 2 als Open-Source-Modell auf Hugging Face veröffentlicht, was die Zugänglichkeit für die breitere KI-Community sicherstellt. Die Veröffentlichung umfasst nicht nur die Modell-Checkpoints, sondern auch die zugehörigen Trainingsdaten (Nemotron-Cascade-2-RL-data und Nemotron-Cascade-2-SFT-Data). Dies fördert Transparenz und ermöglicht Forschenden und Entwicklern, die Modellarchitektur und die Trainingsmethoden detailliert zu untersuchen und darauf aufzubauen.

Die Lizenzierung erfolgt unter der NVIDIA Open Model License, was die Nutzung und Weiterentwicklung im Einklang mit den Bestimmungen von NVIDIA regelt.

Implikationen für die B2B-Anwendung

Für Unternehmen, die KI-Lösungen in ihre Geschäftsabläufe integrieren möchten, bietet Nemotron-Cascade 2 mehrere interessante Perspektiven:

Effizienz bei komplexen Aufgaben: Die hohe Intelligenzdichte und die Fähigkeit, anspruchsvolle Denkaufgaben zu lösen, können die Effizienz in Bereichen wie wissenschaftlicher Forschung, Ingenieurwesen und komplexer Datenanalyse erheblich steigern.
Flexible Integration: Die Unterstützung beider Betriebsmodi – Thinking und Instruct – ermöglicht eine flexible Anpassung an unterschiedliche Anwendungsfälle, von der automatisierten Berichterstattung bis hin zur Unterstützung bei der Problemlösung.
Open-Source-Vorteile: Die Verfügbarkeit als Open-Source-Modell reduziert potenzielle Eintrittsbarrieren und fördert die schnelle Integration in bestehende Infrastrukturen sowie die Anpassung an spezifische Unternehmensbedürfnisse.
Potenzial für maßgeschneiderte Lösungen: Durch den Zugriff auf Trainingsdaten und die Möglichkeit zur Feinabstimmung können Unternehmen maßgeschneiderte KI-Modelle entwickeln, die präzise auf ihre Branchenanforderungen zugeschnitten sind.

Die Veröffentlichung von Nemotron-Cascade 2 durch NVIDIA stellt somit einen wichtigen Schritt in der Entwicklung von LLMs dar. Die Kombination aus innovativer Architektur, beeindruckender Leistungsfähigkeit und offener Zugänglichkeit schafft neue Möglichkeiten für die Anwendung von KI in einer Vielzahl von Geschäftsbereichen.

Schlussbetrachtung

Nemotron-Cascade 2 steht exemplarisch für den fortlaufenden Fortschritt im Bereich der Künstlichen Intelligenz. Seine Fähigkeit, komplexe Denkaufgaben mit hoher Präzision zu lösen und dabei flexibel in verschiedenen Modi zu agieren, unterstreicht das Potenzial von LLMs für anspruchsvolle Anwendungen. Die Open-Source-Verfügbarkeit fördert zudem die Kollaboration und Innovation innerhalb der globalen KI-Community und bietet Unternehmen eine solide Grundlage für die Entwicklung zukunftsweisender KI-Lösungen.

Bibliography

- "nvidia/Nemotron-Cascade-2-30B-A3B - Hugging Face". Hugging Face. Published March 19, 2026. - "Nemotron-Cascade 2 - a nvidia Collection - Hugging Face". Hugging Face. Published March 19, 2026. - "Paper page - Nemotron-Cascade 2: Post-Training LLMs with ...". Hugging Face. Published March 19, 2026. - "Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and ...". NVIDIA Research. - "nvidia/Nemotron-Cascade-2-RL-data · Datasets at Hugging Face". Hugging Face. Published March 19, 2026. - "nvidia/Nemotron-Cascade-2-30B-A3B · Add eval results". Hugging Face. Published March 19, 2026. - "NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model". NVIDIA Research. Published September 2, 2025. - "Paper page - Nemotron-Cascade: Scaling Cascaded Reinforcement Learning for General-Purpose Reasoning Models". Hugging Face. Published December 15, 2025. - "nvidia/Nemotron-Cascade-8B - Hugging Face". Hugging Face. Published December 8, 2025. - "Nemotron-Cascade: Scaling Cascaded Reinforcement Learning for General-Purpose Reasoning Models - NVIDIA Nemotron". NVIDIA Research. Published December 15, 2025.