Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Fähigkeit, grosse Mengen an Dokumenten effektiv zu durchsuchen und daraus präzise Informationen zu extrahieren, ist sowohl für Menschen als auch für künstliche Intelligenzen eine zentrale Herausforderung. Insbesondere im B2B-Umfeld, wo es um die Analyse umfangreicher Verträge, technischer Spezifikationen oder Finanzberichte geht, entscheidet die Effizienz dieser Prozesse massgeblich über den Erfolg. Eine aktuelle Forschungsarbeit mit dem Titel "Strategic Navigation or Stochastic Search? How Agents and Humans Reason Over Document Collections" beleuchtet die Kernfrage, ob moderne KI-Agenten eine echte strategische Argumentation an den Tag legen oder lediglich auf stochastische Suchverfahren zurückgreifen, wenn sie mit heterogenen Dokumentsammlungen konfrontiert sind.
Traditionelle Ansätze in der Dokumentenanalyse, insbesondere bei Retrieval-Augmented Generation (RAG)-Systemen, behandeln Dokumente oft als eine flache Sammlung unstrukturierter Textblöcke. Diese Methode vernachlässigt die inhärente hierarchische Struktur und sequenzielle Logik, die für das menschliche Verständnis von Dokumenten essenziell sind. Diese "strukturelle Blindheit" führt dazu, dass Agenten relevante Informationen möglicherweise übersehen oder in ineffizienten Suchschleifen verharren.
Ein wesentlicher Punkt, der in der Forschung hervorgehoben wird, ist die Diskrepanz zwischen der Rohgenauigkeit von KI-Agenten und ihrer Fähigkeit zu strategischer Planung. Während einige der besten Agenten die Genauigkeit menschlicher Sucher erreichen können, tun sie dies oft durch einen Brute-Force-Ansatz, der schwache strategische Planung kompensiert. Dies führt dazu, dass sie einen erheblichen Leistungsrückstand von fast 20% gegenüber idealen (Orakel-)Lösungen aufweisen und in unproduktiven Schleifen gefangen bleiben können.
Um die Fähigkeiten von Agenten in Bezug auf strategische Argumentation präziser zu bewerten, wurde der MADQA-Benchmark eingeführt. Dieser umfasst 2.250 von Menschen formulierte Fragen, die sich auf 800 heterogene PDF-Dokumente beziehen. Der Benchmark wurde nach der Klassischen Testtheorie konzipiert, um eine maximale Unterscheidungskraft über verschiedene Agentenfähigkeiten hinweg zu gewährleisten. Ein neuartiges Evaluierungsprotokoll misst dabei den Kompromiss zwischen Genauigkeit und Aufwand, was eine tiefere Analyse des Agentenverhaltens ermöglicht.
Als Antwort auf die Limitationen bestehender Agenten-Frameworks wurde DeepRead entwickelt. Dieser Agent für strukturbasierte Dokumentenanalyse zielt darauf ab, die dokumenteigene hierarchische und sequenzielle Logik in handlungsfähige Denkfähigkeiten umzusetzen. DeepRead konstruiert ein koordinatenbasiertes Navigationssystem auf Absatzzebene und stattet das Large Language Model (LLM) mit zwei Tools aus:
Dieses Design emuliert ein menschliches "lokalisieren-dann-lesen"-Paradigma, das die Kontextfragmentierung traditioneller Retrieval-Methoden effektiv mindert. Die Implementierung von DeepRead, die auf dem autonomen Entscheidungsfindungs-Paradigma des agentenbasierten Suchansatzes aufbaut, beseitigt eine zentrale Schwachstelle: das Fehlen einer dokumenteneigenen Topologie in der Interaktionsschnittstelle.
Interessanterweise zeigt die Analyse, dass Menschen bei der Informationssuche in Dokumenten selten auf einen einzigen, linearen Scan oder zufälliges Stichwort-Matching setzen. Stattdessen wenden sie eine strukturierte "lokalisieren-dann-lesen"-Strategie an: Zuerst wird die Position grob lokalisiert, dann folgt ein genaues Lesen. DeepRead ahmt dieses Verhalten nach. Die Ergebnisse zeigen, dass DeepRead in der Lage ist, menschlich-ähnliche Lesemuster zu erlernen, die gezielte Suche mit sequentiellem Lesen ausbalancieren.
Ein Vergleich mit dem DQN-Algorithmus (Deep Q-Network), der ohne diese gezielte Probenahme arbeitet, zeigt, dass DOCQN (DQN mit Baumstichprobenentnahme) DQN übertrifft, insbesondere wenn die Antwort tiefer im Dokument liegt. Dies deutet darauf hin, dass DOCQN lernt, Antworten auch in tieferen Dokumentenbereichen zu finden. Auch wenn DOCQN im Durchschnitt nur 6% der gesamten Dokumententoken verbraucht, übertrifft es informationsabrufbasierte Methoden, die das gesamte Dokument verarbeiten.
Umfassende Evaluierungen von DeepRead über vier Benchmarks, einschliesslich Finanzanalysen und Multi-Dokumenten-Argumentation, zeigen, dass DeepRead die Search-o1-basierten Agenten-Such-Baselines um durchschnittlich 10,3% übertrifft. Diese signifikanten Verbesserungen unterstreichen die Wirksamkeit eines expliziten Zugangs zur Dokumentenhierarchie und sequenziellen Struktur. Die Studien belegen, dass die semantische, koordinatenbasierte Lesestrategie von DeepRead effektiver ist als das einfache Hinzufügen von Kontext durch Fenster-basierte Erweiterungen, um Fragmentierung zu mindern.
Die Fähigkeit von KI-Systemen, Dokumentenstrukturen zu verstehen und zu nutzen, ist ein entscheidender Schritt, um komplexe, dokumentenintensive Arbeitsabläufe zu automatisieren. Für B2B-Anwendungen bedeutet dies präzisere und effizientere Informationsgewinnung, was zu besseren Geschäftsentscheidungen und optimierten Prozessen führen kann. Die Weiterentwicklung in diesem Bereich wird es ermöglichen, KI-Partner zu schaffen, die nicht nur Daten verarbeiten, sondern auch strategisch und kontextuell fundierte Erkenntnisse liefern.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen