Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
NVIDIA hat kürzlich die Veröffentlichung von Nemotron 3 Super auf Hugging Face bekannt gegeben. Dieses Sprachmodell, das auf einer hybriden Mamba-Transformer-Mixture-of-Experts (MoE)-Architektur basiert, ist für seine Fähigkeiten im Bereich des agentischen Denkens, insbesondere für Coding und die Nutzung von Tools, konzipiert. Mit insgesamt 120 Milliarden Parametern, von denen 12 Milliarden aktiv sind, und einem Kontextfenster von bis zu 1 Million Token, positioniert sich Nemotron 3 Super als eine Entwicklung im Bereich der offenen Modelle für anspruchsvolle B2B-Anwendungen.
Die Architektur von Nemotron 3 Super integriert mehrere Schlüsseltechnologien, um eine optimierte Leistung zu erzielen:
Ein zentraler Fokus von Nemotron 3 Super liegt auf agentischen Workflows. Dies bedeutet, dass das Modell in der Lage ist, Aufgaben autonom zu planen, auszuführen und zu überwachen. Die Modelle sind darauf ausgelegt, komplexe Teilaufgaben innerhalb eines Multi-Agenten-Systems zu bewältigen. Beispiele für potenzielle Anwendungsfälle sind:
Das 1-Million-Token-Kontextfenster ist hierbei von Bedeutung, da es KI-Agenten ermöglicht, den vollständigen Workflow-Zustand im Speicher zu behalten und somit ein "Ziel-Drift" über längere Aufgaben hinweg zu verhindern. Zudem bietet das Modell konfigurierbare "Reasoning ON/OFF"-Modi und ein "Thinking Budget", um die Anzahl der Tokens, die für Denkprozesse im Gegensatz zur Standardgenerierung verwendet werden, präzise zu steuern und so die Inferenzkosten zu optimieren.
NVIDIA verfolgt mit Nemotron 3 Super einen Ansatz der Offenheit. Das Modell wird mit offenen Gewichten unter einer permissiven Lizenz veröffentlicht. Zusätzlich stellt NVIDIA die verwendeten Trainingsdaten und Rezepte zur Verfügung, einschliesslich über 10 Billionen Tokens an Pre- und Post-Trainingsdatensätzen sowie 15 Trainingsumgebungen für Reinforcement Learning. Dies soll Entwicklern und Forschern die Möglichkeit geben, das Modell anzupassen und weiterzuentwickeln.
Nemotron 3 Super ist über Plattformen wie Hugging Face zugänglich und kann über verschiedene Partner und Cloud-Dienste bereitgestellt werden, darunter Google Cloud's Vertex AI, Oracle Cloud Infrastructure, und in Kürze auch Amazon Bedrock sowie Microsoft Azure. Das Modell ist auch als NVIDIA NIM Mikroservice verfügbar, was die Bereitstellung von lokalen Systemen bis zur Cloud ermöglicht.
Das Modell demonstriert seine Leistung in verschiedenen Benchmarks. Nemotron 3 Super erreicht laut NVIDIA eine bis zu 2,2-mal höhere Inferenz-Durchsatzrate als GPT-OSS-120B und eine bis zu 7,5-mal höhere Rate als Qwen3.5-122B bei vergleichbarer oder höherer Genauigkeit. Insbesondere bei langen Kontextlängen übertrifft es andere Modelle auf RULER bei 1 Million Kontextlänge. Das Modell hat zudem Spitzenpositionen in Benchmarks wie DeepResearch Bench und DeepResearch Bench II erreicht, die die Fähigkeit eines KI-Systems zur Durchführung gründlicher, mehrstufiger Forschung über große Dokumentensätze hinweg messen.
NVIDIA Nemotron 3 Super stellt eine Entwicklung in der Landschaft der offenen Sprachmodelle dar. Durch die Kombination einer hybriden Mamba-Transformer-MoE-Architektur mit einem umfangreichen Kontextfenster und einem Fokus auf agentisches Denken bietet das Modell eine Grundlage für die Entwicklung anspruchsvoller KI-Anwendungen im B2B-Bereich. Die Offenheit in Bezug auf Gewichte, Daten und Trainingsrezepte fördert zudem die Kollaboration und Weiterentwicklung innerhalb der KI-Gemeinschaft.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen