Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Landschaft der Künstlichen Intelligenz (KI) entwickelt sich rasant weiter, und mit ihr steigen die Anforderungen an effiziente Datenverwaltung und -speicherung. In diesem Kontext hat Hugging Face, bekannt als zentrale Plattform für Open-Source-KI-Modelle und -Datensätze, eine signifikante Neuerung in seiner huggingface_hub-Bibliothek vorgestellt: die Einführung von "Buckets" in Version 1.5.0. Diese Entwicklung markiert einen wichtigen Schritt zur Optimierung der Speicherung großer, dynamischer Datensätze, die in modernen KI-Entwicklungsprozessen anfallen.
Hugging Face Buckets sind eine neue Form des Objektspeichers, der eine S3-ähnliche Funktionalität direkt auf der Hugging Face Plattform bietet. Im Kern nutzen diese Buckets das Xet-Speicher-Backend, welches speziell für große Dateien und Inhalts-adressierbare Deduplizierung konzipiert wurde. Im Gegensatz zu den traditionellen Git-basierten Repositories auf Hugging Face, die eine vollständige Versionshistorie jedes Dateizustands speichern, konzentrieren sich Buckets auf die effiziente Speicherung von großen Dateien, die keine umfassende Git-Historie benötigen.
Die primäre Zielsetzung von Buckets ist es, eine schnelle, veränderliche und skalierbare Speicherlösung für Anwendungsfälle bereitzustellen, bei denen die Dateiversionierung auf Git-Ebene nicht erforderlich oder sogar hinderlich ist. Dazu gehören beispielsweise:
Die Implementierung durch das Xet-Backend ermöglicht eine chunk-basierte Deduplizierung, was bedeutet, dass nur die tatsächlich geänderten Datenblöcke übertragen und gespeichert werden. Dies kann zu erheblichen Effizienzsteigerungen bei Uploads und Downloads führen, insbesondere bei iterativen Änderungen an großen Dateien.
Die Interaktion mit den neuen Buckets ist sowohl über eine erweiterte Befehlszeilenschnittstelle (CLI) als auch über eine dedizierte Python-API (HfApi) möglich. Dies bietet Entwicklern Flexibilität, je nachdem, ob sie manuelle Operationen durchführen oder Bucket-Funktionalitäten in ihre Skripte und Anwendungen integrieren möchten.
Über die CLI können Benutzer beispielsweise Buckets erstellen, Dateien hoch- und herunterladen, Inhalte synchronisieren und Bucket-Informationen abrufen. Die Befehle sind intuitiv gestaltet und ähneln gängigen Dateiverwaltungstools wie rsync für Synchronisierungsaufgaben.
Die Python-API ermöglicht eine programmatische Steuerung aller Bucket-Operationen, was für automatisierte Workflows und die Integration in ML-Frameworks unerlässlich ist. Funktionen wie create_bucket(), batch_bucket_files() für Uploads und Deletionen sowie download_bucket_files() sind direkt verfügbar.
Ein besonderes Merkmal der Buckets ist die leistungsstarke Synchronisierungsfunktion, die eine lokale Verzeichnisstruktur mit einem Bucket abgleichen kann. Diese Funktion vergleicht Dateien basierend auf Größe und Änderungszeit und überträgt nur die geänderten Daten. Optionen wie --delete ermöglichen es, Dateien im Ziel zu entfernen, die in der Quelle nicht mehr existieren. Ferner können Filterregeln (--include, --exclude) angewendet werden, um den Synchronisierungsumfang präzise zu steuern.
Für kritische Operationen bietet die Synchronisierungsfunktion einen Planungsmodus (--plan), der es ermöglicht, den geplanten Abgleich vor der eigentlichen Ausführung zu überprüfen. Dies minimiert das Risiko unbeabsichtigter Datenänderungen und ermöglicht eine "Review-before-Execute"-Strategie. Ein "Dry Run"-Modus (--dry-run) ist ebenfalls verfügbar, um eine Vorschau der Operationen zu erhalten, ohne Änderungen vorzunehmen.
Für Unternehmen, die KI-Modelle entwickeln und betreiben, bieten die neuen Hugging Face Buckets mehrere signifikante Vorteile:
Neben der Einführung der Buckets bietet die Version 1.5.0 der huggingface_hub-Bibliothek weitere wichtige Verbesserungen:
Die Einführung von Buckets in huggingface_hub v1.5.0 stellt eine strategische Erweiterung der Hugging Face Plattform dar, die speziell auf die Anforderungen moderner KI-Workflows zugeschnitten ist. Durch die Bereitstellung eines S3-ähnlichen Objektspeichers mit fortschrittlicher Deduplizierung und einer robusten API-Schnittstelle wird die Verwaltung großer Datensätze und Modell-Artefakte erheblich vereinfacht und beschleunigt. Diese Entwicklung unterstreicht das Engagement von Hugging Face, die Infrastruktur für die Open-Source-KI-Gemeinschaft kontinuierlich zu verbessern und Unternehmen leistungsstarke Werkzeuge für ihre KI-Initiativen an die Hand zu geben.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen