Sie sind hier

Einzelklagen gegen KI-Unternehmen von sechs US-amerikanischen Autor*innen

Branchen-News
Sandra Uschtrin
Möwe sitzt auf Statue der Justitia

Sechs US-amerikanische Autor*innen haben im Dezember 2025 individuelle Klagen beim District Court des Nördlichen Bezirks von Kalifornien eingereicht. Die Beklagten sind die KI-Unternehmen: Anthropic, OpenAI, Google, Meta, xAI und Perplexity AI. Es geht um bewussten Diebstahl, um die vorsätzliche Verletzung des Urheberrechts zwecks Profitmaximierung auf Kosten der Urheber*innen. Und um Schadensersatz in Höhe von 150.000 US-Dollar je Autor*in.

Die US-amerikanischen Autor*innen John Carreyrou, Lisa Barretta, Philip Shishkin, Jane Adams, Matthew Sacks und Michael Kochin haben am 22. Dezember 2025 individuelle Klagen wegen Verletzungen des Urheberrechts gegen die KI-Unternehmen Anthropic, OpenAI, Google, Meta, xAI und Perplexity AI eingereicht. 

Sie werfen den Unternehmen vor, ihre Bücher aus Piratenbibliotheken wie LibGen, Z-Library und OceanofPDF kopiert zu haben, um damit ihre großen Sprachmodelle zu trainieren, und das ohne Erlaubnis, Lizenzierung oder Entschädigung. 

Als Schadenersatz fordern die Kläger*innen 150.000 US-Dollar je Person.

Einzelklagen gegen KI-Unternehmen

Es handelt sich um keine Sammelklage. Die sechs Autor*innen wollen die Unternehmen nicht so billig davonkommen lassen, wie das in den USA bei Sammelklagen und Vergleichen oft der Fall ist. Daher gehen sie in Einzelklagen gegen die KI-Unternehmen vor.

Klage Carreyrou gegen Anthropic PBC

In der Einführung zur Klage Carreyrou gegen Anthropic PBC (3:25-cv-10897) vom District Court des Nördlichen Bezirks von Kalifornien heißt es (übersetzt mit Deepl): 

1. Dieser Fall betrifft einen eindeutigen und vorsätzlichen Diebstahl, der eine Urheberrechtsverletzung darstellt. Anthropic, Google, OpenAI, Meta, xAI und Perplexity haben ohne Genehmigung illegal große Mengen urheberrechtlich geschützter Bücher kopiert und diese gestohlenen Kopien dann verwendet, um ihre kommerziellen großen Sprachmodelle („LLMs“) zu erstellen und zu trainieren und/oder ihr Produkt zu optimieren. Die Beklagten haben sich an den urheberrechtlich geschützten Werken von Hunderten von Autoren bedient – darunter Bestsellerautoren, Pulitzer-Preisträger und Autoren von vielgelesenen Sach- und Belletristikwerken.

2. Anstatt Lizenzen zu erwerben oder für die Nutzung dieser Werke zu bezahlen, hat jeder Beklagte Raubkopien der Bücher der Kläger von Schattenbibliotheks-Websites wie LibGen, Z-Library und OceanofPDF heruntergeladen und diese Werke dann reproduziert, analysiert, erneut kopiert, verwendet und in ihre LLMs eingebettet (und/oder diese Werke zur Optimierung ihres Produkts verwendet), um die kommerzielle Entwicklung zu beschleunigen und das Rennen um generative KI zu gewinnen. Das Urheberrechtsgesetz verbietet genau dieses Verhalten.

3. Die Beklagten haben die Werke der Kläger ins Visier genommen, weil sie als Trainingsdaten von außergewöhnlichem Wert waren. Die Beklagten haben intern und öffentlich anerkannt, dass umfangreiche, hochwertige Bücher das „Goldstandard“-Trainingsmaterial für LLMs sind. Bücher vermitteln Modellen, wie Erzählungen ablaufen, wie menschliche Ausdrucksweisen strukturiert sind, wie Syntax und Rhythmus funktionieren und wie Ideen durch kreative Entscheidungen vermittelt werden. Anstatt für diesen Wert zu bezahlen, haben die Beklagten illegale Kopien gestohlen und diese Kopien verwendet, um Systeme aufzubauen, die heute viele hundert Milliarden Dollar wert sind. 

4. Die Rechtsverletzung erfolgte hier mindestens zweimal für jedes Werk.

5. Zunächst haben die Beklagten die urheberrechtlich geschützten Bücher der Kläger aus illegalen Schattenbibliotheken bezogen.

6. Anschließend fertigten die Beklagten zusätzliche nicht lizenzierte Kopien der unrechtmäßig erworbenen Bücher an, unter anderem während der Erfassung, Vorverarbeitung und Modellschulung und/oder der abrufgestützten Generierung. Die LLM-Schulung erfordert zwangsläufig die Anfertigung mehrerer Kopien jedes Werks.

7. Das Fehlverhalten der Beklagten war vorsätzlich. Die Bibliotheken, auf die die Beklagten zugegriffen hatten, waren seit Jahren Gegenstand strafrechtlicher Verfolgungen, Zivilklagen und weit verbreiteter Warnungen innerhalb der Technologiebranche. Den Beklagten wurde wiederholt mitgeteilt, dass die Verwendung solcher Datensätze rechtswidrig sei, und Mitarbeiter aus der gesamten Branche warnten vor deren Verwendung, darunter einige, die sie als „illegale Piraterie-Websites” bezeichneten und vor der Haftung für den Zugriff darauf warnten. Die Beklagten setzten sich jedoch durch, da sie durch das Kopieren von Raubkopien schneller und kostengünstiger komplexere Modelle mit höherer Leistung erstellen konnten. Diese Entscheidungen verschafften den Beklagten einen Wettbewerbsvorteil – einen Vorteil, der auf der kontinuierlichen und rechtswidrigen Vervielfältigung von Raubkopien beruhte.

8. Die Claude-Modelle von Anthropic wurden anhand von Datensätzen trainiert, die Hunderttausende von Büchern aus Raubkopien enthielten, darunter auch urheberrechtlich geschützte Bücher der Kläger. Die Gemini- und Imagen-Modelle von Google basieren auf Datensätzen – darunter Z-Library und OceanofPDF –, die große Sammlungen von Raubkopien enthalten. Die Modelle der GPT-Serie von OpenAI und Microsoft wurden anhand umfangreicher Raubkopien-Korpora, darunter LibGen, trainiert, wodurch Produkte wie ChatGPT, Copilot, GitHub Copilot und eine Reihe von KI-gestützten Microsoft-Anwendungen ermöglicht wurden. Die Llama-Modelle von Meta wurden mit riesigen Mengen von Büchern trainiert, die aus Schattenbibliotheken, darunter LibGen, heruntergeladen wurden. Die Grok-Modelle von xAI und die KI-Suchsysteme von Perplexity stützten sich ebenfalls auf die groß angelegte Aufnahme von Raubkopien von Büchern. Diese Modelle, die alle mit den urheberrechtlich geschützten Büchern der Kläger trainiert und/oder optimiert wurden, bilden heute die Grundlage für Produktökosysteme im Wert von mehreren Milliarden Dollar.

9. Das unbefugte Kopieren der Bücher der Kläger durch die Beklagten hat unmittelbaren und anhaltenden Schaden verursacht. Die Kläger haben Jahre damit verbracht, die fraglichen Werke zu schaffen; die Beklagten haben sie in Sekundenschnelle kopiert. Durch die Einbettung der kreativen Ausdrucksformen der Kläger in ihre Modellparameter und/oder Optimierungen haben sich die Beklagten die Früchte der urheberrechtlich geschützten Arbeit der Kläger auf Cloud-Plattformen, in Verbraucherprodukten, Unternehmens-Tools, Werbesystemen und Abonnementdiensten angeeignet und monetarisieren diese weiterhin.

10. Das Verhalten der Beklagten stellt zwar eine klassische Urheberrechtsverletzung dar, ist jedoch insofern einzigartig, als sie vorsätzlich und in einem beispiellosen Ausmaß die Urheberrechte der Kläger verletzt haben, um massive wirtschaftliche Gewinne zu erzielen.

11. Um die wiederholte, rechtswidrige und massive Verletzung ihrer Werke durch die Beklagten zu ahnden, fordert jeder Kläger einzeln (1) Schadenersatz, (2) eine dauerhafte Unterlassungsverfügung, die den Beklagten die weitere Verletzung untersagt, und (3) alle weiteren Rechtsbehelfe, die das Gesetz vorsieht. 

12. Die Kläger erheben diese Klage, um die Beklagten für die Verletzung zur Verantwortung zu ziehen, die ihnen den Aufstieg auf dem Markt für generative KI ermöglicht hat, und um das Grundprinzip durchzusetzen, dass kreative Ausdrucksformen nicht ohne Genehmigung oder Entschädigung übernommen, kopiert oder verwertet werden dürfen. 

13. Die Kläger entscheiden sich dafür, diese Klage nicht als Sammelklage einzureichen, da sie gemäß dem Urheberrechtsgesetz Anspruch auf individuellen, von einer Jury festgelegten Schadenersatz für jede Verletzung ihrer Werke durch die Beklagten haben. Die Kläger möchten die volle Kontrolle über ihren Fall behalten und vermeiden, dass ihre Rechte durch weitreichende Sammelklagen, die darauf ausgerichtet sind, Ansprüche für einen Bruchteil ihres Wertes beizulegen, verwässert werden.

14. Die Gefahr ist nicht hypothetisch. In der Sammelklage gegen Anthropic, die derzeit vor dem Northern District of California anhängig ist, hat das Gericht kürzlich vorläufig einen Vergleichsrahmen genehmigt, wonach jedes Werk nur etwa 3.000 US-Dollar abzüglich Anwaltskosten und -gebühren erhält – ein winziger Bruchteil (nur 2 %) der gesetzlichen Obergrenze von 150.000 US-Dollar gemäß dem Urheberrechtsgesetz zusätzlich zu den Anwaltskosten pro vorsätzlich verletztem Werk.

15. Diese anhängigen Sammelklagen und vorgeschlagenen Vergleiche scheinen den Beklagten zu dienen, nicht den Urhebern. LLM-Unternehmen sollten nicht in der Lage sein, Tausende und Abertausende von hochpreisigen Ansprüchen so einfach zu einem Spottpreis auszulöschen und damit die tatsächlichen Kosten ihrer massiven vorsätzlichen Rechtsverletzung zu verschleiern.

16. Das ist nicht die Vorgehensweise, die die Kläger planen. Nach der geltenden Rechtsprechung des Obersten Gerichtshofs ist „die Höhe des gesetzlichen Schadenersatzes eine Frage für die Jury“. Das Urheberrechtsgesetzes räumt den Urhebern somit das Recht ein, die Vorsätzlichkeit der Verletzung durch eine Jury bewerten zu lassen und einen Schadensersatzbetrag festzusetzen, der auf das Verhalten des Beklagten zugeschnitten ist.

17. Zusammenfassend lässt sich sagen, dass das System des Urheberrechtsgesetzes für gesetzlichen Schadensersatz und Anwaltskosten es einzelnen Urhebern ermöglicht, Verletzer zur Verantwortung zu ziehen, ohne dass eine Sammelklage erforderlich ist. Das ist es, wofür sich die Kläger entschieden haben.

Blogbild: Foto (Ausschnitt): Greg Montani, Pixabay