Für Teams, Einzelnutzer, Kanzleien und Transkription – derselbe Mindverse Look, klar aufgeteilt nach Anwendungsfall.
für Teams und Unternehmen
Die Plattform für Unternehmen, die eigene KI-Workflows, Wissensdatenbanken und Assistenten produktiv einsetzen möchten.
für Einzelnutzer und Creator
Der einfachste Einstieg in das Mindverse-Ökosystem für Content, Recherche, Bilder, Audio und produktives Arbeiten.
für Juristen und Kanzleien
Die spezialisierte KI-Lösung für juristische Recherche, Vertragsarbeit und kanzleispezifische Workflows.
für Audio, Meetings und Transkription
Schnelle KI-Transkription für Audiodateien und Meetings – ideal zum sofortigen Start oder für regelmäßige Nutzung.

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Landschaft der Künstlichen Intelligenz wird kontinuierlich durch Innovationen geprägt, die neue Möglichkeiten für Unternehmen und Entwickler eröffnen. Eine dieser jüngsten Entwicklungen ist die Veröffentlichung von "Cohere Transcribe", einem Open-Source-Modell für die automatische Spracherkennung (ASR), das laut Berichten eine führende Position in puncto Genauigkeit einnimmt.
Das von Cohere entwickelte Modell "Transcribe" hat sich an die Spitze des Hugging Face Open ASR Leaderboards gesetzt. Es erreicht eine bemerkenswert niedrige durchschnittliche Wortfehlerrate (WER) von 5,42 %. Diese Kennzahl ist entscheidend für die Beurteilung der Leistungsfähigkeit eines Spracherkennungssystems, da sie den Prozentsatz falsch transkribierter Wörter im Verhältnis zu einer Referenztranskription angibt. Ein niedrigerer WER-Wert deutet auf eine höhere Genauigkeit hin.
Im Vergleich zu anderen Modellen wie Zoom Scribe v1, IBM Granite 4.0 1B, ElevenLabs Scribe v2 und Qwen3-ASR-1.7B Speech zeigt "Transcribe" eine überlegene Performance. Menschliche Evaluatoren bevorzugten die Transkriptionen von "Transcribe" in 61 % der Fälle gegenüber denen der Konkurrenzmodelle, insbesondere hinsichtlich Genauigkeit, Kohärenz und Benutzerfreundlichkeit. Es ist jedoch anzumerken, dass das Modell in bestimmten Sprachen wie Portugiesisch, Deutsch und Spanisch noch nicht die gleiche Spitzenleistung wie in anderen Sprachen erreicht.
"Cohere Transcribe" basiert auf einer Conformer-Architektur, die als Hybrid aus Convolutional Neural Networks (CNNs) und Transformatoren konzipiert ist. Diese Kombination ermöglicht es dem Modell, sowohl feingranulare akustische Details als auch weitreichende sprachliche Abhängigkeiten effektiv zu erfassen. Mit lediglich 2 Milliarden Parametern ist das Modell vergleichsweise schlank. Dies ermöglicht den Betrieb auf handelsüblichen GPUs, was die Zugänglichkeit und die Optionen für das Selbst-Hosting erheblich verbessert.
Ein weiteres Merkmal ist die Fähigkeit von "Transcribe", lange Audioaufnahmen effizient zu verarbeiten. Das Modell ist darauf ausgelegt, Audio in 35-Sekunden-Segmenten zu bearbeiten. Für längere Dateien wird eine automatische Segmentierung mit überlappenden Abschnitten angewendet, gefolgt von einer Rekonstruktion des Textes, um Kontinuität zu gewährleisten. Diese Methode stellt sicher, dass auch längere Aufnahmen, wie beispielsweise 55-minütige Konferenzschaltungen, ohne Leistungseinbußen oder übermäßigen Speicherverbrauch verarbeitet werden können. Cohere gibt an, dass "Transcribe" 525 Minuten Audio in nur einer Minute Rechenzeit verarbeiten kann, was eine hohe Verarbeitungsgeschwindigkeit für diese Modellklasse darstellt.
"Transcribe" unterstützt zum Start 14 Sprachen: Englisch, Französisch, Deutsch, Italienisch, Spanisch, Portugiesisch, Griechisch, Niederländisch, Polnisch, Chinesisch, Japanisch, Koreanisch, Vietnamesisch und Arabisch. Diese Mehrsprachigkeit eröffnet vielfältige Anwendungsmöglichkeiten in globalen Kontexten.
Cohere plant, "Transcribe" in seine Unternehmensplattformen zu integrieren, darunter die Agenten-Orchestrierungsplattform North. Zudem wird das Modell über die Cohere API kostenlos zur Verfügung gestellt und ist auch über die verwaltete Inferenzplattform Model Vault zugänglich. Diese breite Verfügbarkeit unterstreicht das Ziel, fortschrittliche KI-Funktionen für ein breites Spektrum von Anwendern zugänglich zu machen.
Die Veröffentlichung von "Cohere Transcribe" erfolgt in einer Zeit des wachsenden Bedarfs an Spracherkennungstechnologien. Anwendungen reichen von der automatisierten Protokollierung und Diktierfunktionen bis hin zur Analyse von Kundenservice-Gesprächen und der Erstellung von Untertiteln für Medieninhalte. Die Nachfrage wird durch Trends wie Remote-Arbeit, die Zunahme digitaler Inhalte und den allgemeinen Wunsch nach operativer Effizienz angetrieben.
Cohere, das Unternehmen hinter "Transcribe", ist bekannt für seine Fokussierung auf leistungsstarke KI-Lösungen für Unternehmen. Die Entscheidung, ein so leistungsfähiges Modell als Open Source bereitzustellen, steht im Einklang mit einem breiteren Branchentrend, der darauf abzielt, Entwicklergemeinschaften aufzubauen und die Akzeptanz von Technologien zu beschleunigen. Es ermöglicht Unternehmen und Entwicklern, die Wert auf Datenhoheit, Anpassbarkeit oder Kosteneffizienz legen, die Technologie direkt zu implementieren.
Die Einführung von "Transcribe" durch Cohere stellt einen bedeutenden Fortschritt im Bereich der Spracherkennung dar. Durch die Kombination von hoher Genauigkeit, Effizienz und Zugänglichkeit als Open-Source-Lösung positioniert sich das Modell als ein relevanter Akteur im Wettbewerb um die besten Spracherkennungstechnologien und trägt dazu bei, die Interaktion mit Sprachdaten neu zu gestalten.
Für Unternehmen im B2B-Sektor bietet "Cohere Transcribe" mehrere relevante Vorteile:
Die Entwicklung von "Cohere Transcribe" unterstreicht das dynamische Wachstum im Bereich der Künstlichen Intelligenz und die kontinuierliche Suche nach Lösungen, die sowohl leistungsstark als auch zugänglich sind. Die Auswirkungen auf verschiedene Industrien, die auf präzise Spracherkennung angewiesen sind, werden voraussichtlich erheblich sein.
Bibliography: - Cohere. (2026, March 26). Announcing the Cohere Transcribe model. Release Notes. - Mehta, I. (2026, March 26). Cohere launches an open source voice model specifically for transcription. TechCrunch. - MarkTechPost. (2026, March 26). Cohere AI Releases Cohere Transcribe: A SOTA Automatic Speech Recognition (ASR) Model Powering Enterprise Speech Intelligence. MarkTechPost. - Aggarwal, K. (2026, March 26). Cohere Transcribe: Revolutionary Open-Source Voice Model Shatters Transcription Benchmarks. BitcoinWorld. - Reddit. (2026, March 26). Cohere AI has released Cohere Transcribe, a new 2B parameter Conformer-based ASR model built for open, production-grade speech recognition. r/machinelearningnews. - Mezha. (2026, March 26). Cohere releases Transcribe voice model, beats open source rivals on WER. Mezha. - Hugging Face. (2025, November 21). Open ASR Leaderboard: Trends and Insights with New Multilingual & Long-Form Tracks. Hugging Face Blog. - Oreate AI. (2026, March 5). Navigating the Open ASR Leaderboard: A Deep Dive Into Speech Recognition’s Cutting Edge. Oreate AI Blog. - Artificial Analysis. (n.d.). Speech to Text AI Model & Provider Leaderboard.Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen