Die Initiative Urheberrecht hat eine neue Studie veröffentlicht, die zu dem Schluss kommt, dass das Training von generativen KI-Modellen mit urheberrechtlich geschützten Werken eine Verletzung des Urheberrechts darstellt. Diese Analyse hat das Potenzial, die Nutzung von KI-Technologien erheblich zu beeinflussen und stellt eine Herausforderung für die Urheberrechtsgesetzgebung dar.
Die Studie wurde von Prof. Dr. Tim W. Dornis von der Universität Hannover und Prof. Dr. Sebastian Stober von der Universität Magdeburg durchgeführt. Ziel der Untersuchung war es, die technologischen und rechtlichen Aspekte des Trainings generativer KI-Modelle zu beleuchten. Die Forscher analysierten die Prozesse und Auswirkungen des KI-Trainings auf urheberrechtlich geschützte Werke.
Die Studie zeigt, dass das Training von KI-Modellen wie ChatGPT von OpenAI und Gemini von Google umfangreiche Vervielfältigungen urheberrechtlich geschützter Werke beinhaltet. Diese Vervielfältigungen beginnen mit der Sammlung, Vorbereitung und Speicherung der Daten und setzen sich im Pre-Training und Fine-Tuning fort. Die Modelle memorieren die Daten und können diese später bei der Nutzung durch Endanwender reproduzieren.
Prof. Dornis und Prof. Stober argumentieren, dass das Training generativer KI-Modelle keine Form des erlaubten Text- und Data-Minings darstellt. Im deutschen und europäischen Urheberrecht gibt es keine gültigen Ausnahmen, die ein kommerzielles KI-Training erlauben. Dies bedeutet, dass jede Nutzung urheberrechtlich geschützter Werke ohne Zustimmung der Rechteinhaber eine Urheberrechtsverletzung darstellt.
Die Studie hat bereits zahlreiche Reaktionen hervorgerufen. Axel Voss, Mitglied des Europäischen Parlaments, begrüßte die Ergebnisse und hofft auf ein besseres Gleichgewicht zwischen dem Schutz menschlicher Kreativität und der Förderung von KI-Innovationen. Hanna Möllers, Justiziarin des Deutschen Journalistenverbands, betonte, dass die Studie belegt, dass es sich bei der Nutzung urheberrechtlich geschützter Werke für das KI-Training um einen groß angelegten Diebstahl geistigen Eigentums handelt.
Im Rahmen der EU-Urheberrechtsrichtlinie gibt es Ausnahmen für Text- und Data-Mining, die in Deutschland in den Paragrafen 60d und 44b des Urheberrechtsgesetzes umgesetzt wurden. Diese Ausnahmen gelten jedoch nur für nicht-kommerzielle Forschungseinrichtungen, die ihre Gewinne in die Wissenschaft reinvestieren oder im öffentlichen Interesse tätig sind. Kommerzielle Nutzungen wie das Training generativer KI-Modelle sind davon nicht abgedeckt.
Auf internationaler Ebene laufen bereits mehrere Rechtsstreitigkeiten gegen KI-Unternehmen wie OpenAI. Diese Klagen könnten wegweisend für die zukünftige Handhabung von urheberrechtlich geschütztem Material in KI-Trainingsdaten sein. In Deutschland steht ein Verfahren vor dem Landgericht Hamburg an, bei dem es um die Nutzung urheberrechtlich geschützter Fotografien für den KI-Trainingsdatensatz LAION 5B geht.
Die Ergebnisse der Studie könnten weitreichende Folgen für die KI-Branche haben. Es wird erwartet, dass die Politik Maßnahmen ergreift, um den Schutz der Urheber zu gewährleisten und gleichzeitig die Entwicklung von KI-Technologien zu fördern. Die Schaffung eines neuen, ertragreichen Lizenzmarktes könnte eine Möglichkeit sein, um einen fairen Ausgleich zwischen den Interessen der Kreativen und der Technologieunternehmen zu finden.