KI-Training mit Büchern: Anthropic gewinnt Teilsieg vor US-Gericht

Ein wegweisendes Urteil aus Kalifornien stärkt die Position von KI-Unternehmen im Umgang mit urheberrechtlich geschütztem Material. Das Training von Claude mit Buchinhalten gilt als rechtmäßig – doch Anthropic droht dennoch Ungemach wegen illegaler Downloads.
Das US-Bezirksgericht in Nordkalifornien hat eine grundlegende Entscheidung zur Zukunft der Künstlichen Intelligenz getroffen. Richter William Alsup wies die Klage von drei Autoren gegen Anthropic, den Hersteller des KI-Chatbots Claude, größtenteils ab. Der Kern des Urteils: Das Training von Sprachmodellen mit urheberrechtlich geschützten Büchern stellt keine Rechtsverletzung dar, sofern die Inhalte legal beschafft wurden.
Transformative Nutzung als Schlüsselargument
Die Kläger Andrea Bartz, Charles Graeber und Kirk Wallace Johnson hatten im August 2024 argumentiert, Anthropic habe sich durch den „Diebstahl Hunderttausender urheberrechtlich geschützter Bücher ein Milliardengeschäft“ aufgebaut. Richter Alsup sah das anders. In seiner Begründung betonte er den „grundlegend transformativen“ Zweck des KI-Trainings. Große Sprachmodelle wie Claude lernen aus Texten statistische Zusammenhänge zwischen Wortfragmenten, anstatt die ursprünglichen Werke zu reproduzieren.
Diese Unterscheidung erweist sich als entscheidend. Anders als bei einer simplen Kopie entstehen durch das maschinelle Lernen neue Fähigkeiten, die weit über die ursprünglichen Inhalte hinausgehen. Die KI entwickelt ein Verständnis für Sprache und Kontext, ohne dabei die kreativen Elemente oder den besonderen Stil der Originalwerke zu imitieren.
Rechtliche Weichenstellung für die Branche
Das Urteil dürfte weit über den konkreten Fall hinaus Bedeutung erlangen. Branchenexperten bewerten die Entscheidung als bedeutenden Sieg für KI-Unternehmen, die sich bisher in einer rechtlichen Grauzone bewegten. Anthropic zeigte sich entsprechend zufrieden und erklärte, die Entscheidung sei „vereinbar mit dem Zweck des Urheberrechts, Kreativität zu ermöglichen und wissenschaftlichen Fortschritt zu fördern“.
Für andere KI-Firmen, die mit ähnlichen Klagen konfrontiert sind, könnte das Urteil Präzedenzcharakter haben. Die Rechtsprechung schafft damit erstmals klare Leitlinien für die Verwendung urheberrechtlich geschützter Materialien beim Training von Sprachmodellen.
Fair Use als Schutzschild
Anthropics Vorgehen beim Buchkauf und der anschließenden Digitalisierung stufte das Gericht als rechtmäßig ein. Das Unternehmen hatte Bücher als Printversionen erworben, die Inhalte eingescannt und die physischen Exemplare vernichtet. Die entstandenen PDF-Dateien landeten in einer internen, durchsuchbaren Bibliothek – ein Verfahren, das nach Ansicht des Richters von der Fair-Use-Klausel des amerikanischen Urheberrechts gedeckt ist.
Diese Klausel erlaubt die begrenzte Nutzung urheberrechtlich geschützter Werke für Zwecke wie Kritik, Kommentierung, Parodie oder Forschung. Die transformative Natur des KI-Trainings fällt offenbar in diese Kategorie.
Der Schatten illegaler Downloads
Trotz des Erfolgs in der Hauptsache schwebt eine dunkle Wolke über Anthropic. In den Jahren 2021 und 2022 soll das Unternehmen über sieben Millionen digitale Bücher von Piraterie-Seiten heruntergeladen haben. Diese aus illegalen Quellen stammenden Inhalte wurden dauerhaft gespeichert – darunter auch Werke der klagenden Autoren.
Zwar betont Anthropic, diese Dateien nicht für das KI-Training verwendet zu haben. Doch Richter Alsup sieht das anders: Der Aufbau einer digitalen Bibliothek mit Raubkopien falle nicht unter Fair Use. Hier gebe es auch keine Ausnahme im Urheberrecht für KI-Unternehmen.
Getrennte Verhandlung über Raubkopien
Diese Urheberrechtsverletzung wird nun in einem separaten Verfahren behandelt. Der Richter stellte klar, dass der nachträgliche Kauf eines zuvor illegal beschafften Buches das Unternehmen nicht von der Haftung für den ursprünglichen „Diebstahl“ befreie. Allerdings könne dieser Umstand die Höhe des Schadensersatzes beeinflussen.
Anthropic steht damit vor einem zweischneidigen Ergebnis: Während das Unternehmen in der Grundsatzfrage des KI-Trainings triumphiert, drohen ihm weiterhin rechtliche Konsequenzen für fragwürdige Beschaffungsmethoden.
Ausblick auf die KI-Regulierung
Das Urteil markiert einen wichtigen Meilenstein in der rechtlichen Bewertung von KI-Technologien. Es zeigt, dass Gerichte bereit sind, zwischen legitimen und illegitimen Verwendungen urheberrechtlich geschützter Inhalte zu unterscheiden. Die transformative Natur des maschinellen Lernens wird als schutzwürdig anerkannt – jedoch nur bei legaler Beschaffung der Trainingsdaten.
Für die Zukunft der KI-Entwicklung bedeutet dies eine gewisse Rechtssicherheit, aber auch klare Grenzen. Unternehmen müssen sicherstellen, dass ihre Trainingsdaten aus legalen Quellen stammen. Der Zweck heiligt nicht alle Mittel – auch nicht in der Welt der Künstlichen Intelligenz.
