Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Integration von Künstlicher Intelligenz (KI) in den Finanzsektor verspricht erhebliche Effizienzsteigerungen und neue Analysemöglichkeiten. Insbesondere große Sprachmodelle (Large Language Models, LLMs) zeigen vielversprechende allgemeine Fähigkeiten. Ihre Anwendung im spezifischen und anspruchsvollen Finanzbereich ist jedoch mit Herausforderungen verbunden, die sich aus der dichten domänenspezifischen Terminologie, den strengen Anforderungen an numerisches Schlussfolgern und einer geringen Fehlertoleranz ergeben. Eine aktuelle empirische Studie beleuchtet, wie die Qualität und das Profil der Nachschulungsdaten die Leistung von LLMs in spezialisierten vertikalen Domänen, wie dem Finanzwesen, entscheidend beeinflussen.
Traditionell lag der Fokus bei der Domänenadaption von KI-Modellen auf modellzentrierten Ansätzen, die architektonische Anpassungen oder die Skalierung von Parametern in den Vordergrund stellten. Aktuelle Trends deuten jedoch auf einen Paradigmenwechsel hin zu „datenzentrierter KI“, bei der die Datenqualität der Modellkomplexität überlegen ist. Im Finanzwesen, wo Entscheidungen oft weitreichende Konsequenzen haben, ist die Präzision der Daten und die Verlässlichkeit der Modelloutputs von größter Bedeutung. Fehler in diesem Bereich können erhebliche wirtschaftliche Auswirkungen haben.
Die Studie, die von Forschenden der Shanghai Artificial Intelligence Laboratory und der Hong Kong University of Science and Technology durchgeführt wurde, untersucht diese datenzentrierte Perspektive. Sie postuliert eine zweistufige Datenhierarchie:
Zur Validierung dieser Prämisse wurden zwei komplementäre Datensätze entwickelt: ODA-Fin-SFT-318k und ODA-Fin-RL-12k.
Dieser Datensatz wurde durch eine mehrstufige Destillation und Verifizierung erstellt, um qualitativ hochwertige Chain-of-Thought (CoT)-Supervision in großem Umfang zu erzeugen. Der Prozess umfasst:
Der resultierende Datensatz ODA-Fin-SFT-318k besteht aus 318.000 Samples, die aus über 25 Open-Source-Repositorys stammen und eine breite Abdeckung von Finanzaufgaben, Stimmungsanalysen und numerischem Schlussfolgern bieten.
Für das RL-Training wurde ein Subset von 12.000 Samples, ODA-Fin-RL-12k, kuratiert. Die Auswahl erfolgte nicht nur nach Schwierigkeitsgrad, sondern auch nach Überprüfbarkeit durch einen effizienten Online-Verifizierer. Samples mit einer Fehlerrate von über 50 % bei der Bewertung durch das SFT-Modell werden bevorzugt, um anspruchsvolle Beispiele für das RL-Training zu priorisieren. Zudem wird die maximale Token-Länge der finalen Antwort auf 16 beschränkt, um eine zuverlässige Online-Verifizierung zu ermöglichen.
Das Training erfolgte in zwei Phasen:
Der Belohnungsmechanismus im RL ist mehrstufig aufgebaut:
Die Modelle wurden auf neun Benchmarks bewertet, die allgemeine Finanzaufgaben, Stimmungsanalysen und numerisches Schlussfolgern umfassen. Das Modell ODA-Fin-RL-8B, das auf einem Qwen3-8B-Basismodell basiert, übertraf durchweg den aktuellen Stand der Technik (SOTA) bei Open-Source-Finanz-LLMs vergleichbarer Größe. Es erreichte eine durchschnittliche Leistung von 74,6 % über alle Benchmarks hinweg, was nahezu der Leistung des wesentlich größeren Qwen3-32B (74,7 %) entspricht.
Umfassende Ablationsstudien unterstrichen die Bedeutung der Datenqualität und der Trainingsstrategien:
Die Studie bestätigt die entscheidende Rolle des Data Engineering bei der Entwicklung von Finanz-LLMs. Die Datenqualität, der Schwierigkeitsgrad und die Überprüfbarkeit der Daten sind die primären Faktoren, die die Modellleistung in vertikalen Domänen bestimmen, und nicht allein das Datenvolumen oder die algorithmische Neuheit. Die vorgestellten Datensätze ODA-Fin-SFT-318k und ODA-Fin-RL-12k sowie die trainierten Modelle werden der Forschungsgemeinschaft zur Verfügung gestellt, um den Wandel von modellzentrierter zu datenzentrierter KI in der Finanzintelligenz voranzutreiben.
Diese Erkenntnisse sind für Unternehmen im B2B-Bereich, die KI-Lösungen im Finanzsektor implementieren möchten, von großer Relevanz. Sie zeigen, dass Investitionen in hochwertige Datenaufbereitung und spezialisierte Trainingsstrategien zu überlegenen und verlässlicheren KI-Modellen führen können, selbst im Vergleich zu deutlich größeren, aber weniger domänenspezifisch trainierten Modellen. Dies ermöglicht eine effizientere und präzisere Nutzung von KI, um datengestützte Entscheidungen im anspruchsvollen Finanzumfeld zu treffen.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen