Sie sind hier

Suchformular

Literaturagenturen fordern Entschädigung von KI-Konzernen

Branchen-News
Sandra Uschtrin
Illustration zeigt zwei Diebe, die geistiges Eigentum stehlen. Illustration: Carola Vogt

32 Literaturagenturen in Deutschland, Österreich und der Schweiz haben sich mit Briefen an die Buchbranche und mit einer Petition an den Deutschen Bundestag gewandt. Eine Kommission soll den Schaden beziffern, den die Autor*innen erlitten haben, weil Tech-Konzerne ihnen ihr geistiges Eigentum geklaut haben, um damit ihre KI zu trainieren.

Auch die Literaturagenturen in Deutschland, Österreich und der Schweiz werden jetzt in Sachen Künstlicher Intelligenz (KI) aktiv. Mit Briefen wendeten sie sich Anfang Juni 2025 an die Verwertungsgesellschaft WORT (VG WORT), den Börsenverein des Deutschen Buchhandels und andere Verbände. Außerdem gibt es eine Petition an den Deutschen Bundestag.

In der Petition der Literaturagenturen an den Deutschen Bundestag heißt es:

»In den zurückliegenden 3–5 Jahren wurden Millionen urheberrechtlich geschützter Werke ohne Rechtsgrundlage zum Training von Künstlicher Intelligenz (KI) ausgelesen. Internationale Tech-Konzerne wie OpenAI, Google, Meta und Microsoft haben damit Milliardenwerte erschaffen, ohne diejenigen in irgendeiner Weise zu vergüten, die mit ihren Texten, Bildern oder Kompositionen ungefragt die Basis dafür zur Verfügung gestellt haben.

Wir fordern die Bundesregierung und den Deutschen Bundestag dazu auf,
1.    den massenhaften Diebstahl geistigen Eigentums explizit zu benennen und als solchen zu verurteilen,
2.    die Konzerne, die ihre KI mit dem geistigen Eigentum Dritter trainiert haben, zu verpflichten, eine lückenlose Werkliste zu veröffentlichen, aus der klar ersichtlich ist, welche Werke auf solche Weise missbraucht wurden,
3.    eine gesetzliche Regelung zu schaffen, die verhindert, dass solcher Diebstahl zukünftig straffrei bleibt,
4.    national und übernational darauf hinzuwirken, dass die bereits stattgefunden habende Nutzung geistigen Eigentums nachträglich angemessen vergütet wird.
5.    Programme Künstlicher Intelligenz, deren Grundlagen illegal erschaffen wurden, müssen verboten werden, bis die betreffenden Rechtsverstöße geheilt sind,
6.    Konzerne, die dagegen verstoßen, müssen mit empfindlichen Sanktionen belegt werden.

Die Bundesregierung muss eine unabhängige Kommission zur Bezifferung der mithilfe dieses Diebstahls geistigen Eigentums erschaffenen Werte und zur Ermittlung des den Urhebern so entstandenen Schadens einrichten. Sie muss außerdem die rechtlichen Grundlagen für Entschädigungsforderungen durch die Urheber schaffen, soweit sie noch nicht vorhanden sind.«

Der Brief der Literaturagenturen an die VG WORT lautet:

Sehr geehrter Herr Dr. Staats,

seit geraumer Zeit ist bekannt, dass die Anbieter von Programmen „Künstlicher Intelligenz“ (KI) millionenfachen Diebstahl geistigen Eigentums begangen haben und zweifellos immer weiter begehen. Einzelne Kreative können gegen Weltkonzerne wie Google, Microsoft oder Meta nicht vorgehen, um eine Entschädigung für die unrechtmäßige Ausbeutung ihrer Werke zu fordern und zukünftige missbräuchliche Nutzungen zu verhindern. Deshalb ist das Tätigwerden der großen Interessenverbände so wichtig wie noch nie zuvor.

Überall auf der Welt sind Autoren- und Verlegerverbände sowie andere kulturelle Organisationen dabei, Forderungen an die Konzerne wie auch an die Politik zu richten, um hier Gerechtigkeit herzustellen und eine existenzgefährdende Regelungslücke zu schließen. Wir wissen, dass auch Sie sich in jüngster Zeit intensiv mit dem Thema befasst haben. Doch wir sehen – außer einem sehr halbherzigen Versuch, mittels einer Änderung des Wahrnehmungsvertrags ein Nischenthema zu gestalten – keine Wirkung Ihrer diesbezüglichen Bemühungen. Ja, mehr noch: Wir wissen nicht einmal, welche Ziele die VG Wort zurzeit verfolgt.

Deshalb fordern wir Sie hiermit auf, die Öffentlichkeit zu suchen und gemeinsam mit Ihren Wahrnehmungsberechtigten sowie mit anderen großen Institutionen Forderungen an die KI-Konzerne zu formulieren und durchzusetzen, die Politik zu beraten und zu drängen, Regelungen zu treffen, die die Kreativen vor zukünftigem Diebstahl geistigen Eigentums besser schützen und ihnen Kompensation für den begangenen Diebstahl geistigen Eigentums zu verschaffen.

Soweit der Wahrnehmungsvertrag ein solches Mandat noch nicht trägt, bringen Sie eine entsprechende Änderung auf den Weg, die tatsächlich die Interessen der Mehrheit Ihrer Wahrnehmungsberechtigten berücksichtigt und für diese Mehrheit von Wert ist.

Wir, die Unterzeichnenden, vertreten tausende von Kreativen, die von uns erwarten, dass wir für sie kämpfen, so wie sie es von Ihnen erwarten. In Frankreich, U.K. und den USA, in Deutschland mit der GEMA, sind große Interessenverbände bereits erkennbar und mit Nachdruck aktiv. Die Interessen ihrer Mitglieder werden offensiv und lautstark vertreten. Das wünschen sich unseren Mandanten auch von uns. Daher fordern wir Sie auf: 

1. Schaffen Sie die Grundlagen dafür, dass Sie die begangenen Rechtsverletzungen im Sinne Ihrer Wahrnehmungsberechtigten verfolgen und Kompensation fordern können.
2. Vertreten Sie die Wahrnehmungsberechtigten, indem Sie angemessene Lizenzgebühren nachfordern und durchsetzen.
3. Werden Sie bei der Bundesregierung tätig, damit diese den Schutz geistigen Eigentums stärkt und die KI-Konzerne zu Transparenz und Entschädigung verpflichtet.
4. Schaffen Sie eine Ombudsstelle, zu der Ihre Wahrnehmungsberechtigten jederzeit Kontakt aufnehmen und mit der sie ihre Belange diskutieren können.

Vielen Dank!

Mit freundlichen kollegialen Grüßen 
Zusammenschluss deutschsprachiger Literaturagenturen (ZdL)

Zusammenschluss deutschsprachiger Literaturagenturen (ZDL)

Diese 32 Literaturagenturen sind derzeit im Zusammenschluss deutschsprachiger Literaturagenturen (ZDL):

  1. Agentur Buchplanung  
  2. Agentur Literatur Gudrun Hebel  
  3. Agentur Susanne Koppe 
  4. Auserlesen Ausgezeichnet  
  5. Autoren- und Projektagentur Gerd F. Rumler 
  6. AVA international GmbH 
  7. Barbara Küper Literarische Agentur + Medienservice
  8. Buchplanung Berlin 
  9. Editio Dialog Literary Agency 
  10. erzähl:perspektive Literaturagentur M.Gröner & K. Gröner GbR 
  11. Langenbuch & Weiß Literaturagentur  
  12. Literarische Agentur Kossack GbR 
  13. Literarische Agentur Peter Molden 
  14. Literarische Agentur Silke Weniger 
  15. Literatur Agentur Hanauer 
  16. Literaturagentur Arteaga  
  17. Literaturagentur Beate Riess 
  18. Literaturagentur Brinkmann  
  19. Literaturagentur Cally Stronk 
  20. Literaturagentur Lesen & Hören 
  21. Literaturagentur Wortunion 
  22. litmedia-agency 
  23. medienagentur wilhelmi 
  24. Michael Meller Literary Agency 
  25. Montasser Medienagentur 
  26. Projekt Agentur Störiko-Blume
  27. Rauchzeichen-Agentur
  28. rights & audio Literarische Agentur Charlotte Larat
  29. Schoneburg 
  30. SvH Literarische Agentur 
  31. The Berlin Agency
  32. Wort Weise Agentur und Text

Diese Literaturagenturen vertreten weit über tausend Autor*innen. Mit den Briefen und der Petition wollen die 32 Literaturagenturen einen Diskussionsbeitrag leisten und die Verbände aus ihrem Dornröschenschlaf reißen. »Statt immer neue Arbeitsgruppen zu gründen, sollen sie endlich tätig werden«, wird Literaturagent Thomas Montasser zitiert.

Literaturagenturen erhalten für ihre Vermittlungsbemühungen rund 15 Prozent von den Autorenhonoraren. Wird der Buchmarkt von immer mehr KI-produzierten Büchern überschwemmt und rentiert es sich für Autor*innen nicht mehr, Bücher zu schreiben, wären auch die Literaturagenturen in ihrer Existenz betroffen. 

Bereits im November 2023 hatte sich das Netzwerk Autorenrechte in einem offenen Brief und einer Petition an die Bundesregierung gewandt. Die im Netzwerk Autorenrechte zusammengeschlossenen rund 16.500 Autorinnen und Übersetzer setzen sich für eine Bürger- und kulturfreundliche KI-Regulierung ein.

ChatGPTs »Grobe Schadensschätzung« (1. Abfrage)

Um wie viel Geld geht es bei alledem eigentlich in etwa? Sandra Uschtrin hat ChatGPT folgende Frage gestellt:

»Wie hoch ist der finanzielle Schaden, den deutschsprachige Autorinnen und Autoren erlitten haben, weil ihre Werke zum Trainieren von Künstlicher Intelligenz gestohlen wurden? Nenne eine Zahl in Euro und begründe sie.«

ChatGPT-Antwort: 

»Der finanzielle Schaden, den deutschsprachige Autor:innen durch die unrechtmäßige Nutzung ihrer Werke zum Training von Künstlicher Intelligenz (KI) erlitten haben, lässt sich nur schwer exakt beziffern. Allerdings gibt es Schätzungen und Hinweise, die auf einen erheblichen Verlust hinweisen.

Schätzungen des finanziellen Schadens

Eine Stellungnahme des Netzwerks Autorenrechte (NAR) aus dem Jahr 2023 weist darauf hin, dass Autor:innen und Übersetzer:innen des deutschsprachigen Buchsektors nur mit 5 bis 10 Prozent der Erlöse an der Wertschöpfung von 13,5 Milliarden Euro in Deutschland beteiligt sind. Diese Zahl verdeutlicht die geringe direkte Vergütung für ihre Arbeit im Vergleich zum Gesamtumsatz der Branche. ([netzwerk-autorenrechte.de][1])

Die unrechtmäßige Nutzung ihrer Werke zum KI-Training führt zu einem zusätzlichen finanziellen Verlust, da sie weder für ihre Arbeitsleistung noch für die Nutzung ihrer Werke durch KI-Systeme entschädigt werden. Obwohl keine genaue Zahl genannt wird, lässt sich vermuten, dass der finanzielle Schaden durch die unrechtmäßige Nutzung ihrer Werke zum KI-Training erheblich ist.

Rechtliche Aspekte

Eine Studie der Initiative Urheberrecht (IU) aus dem Jahr 2023 kommt zu dem Schluss, dass die Nutzung urheberrechtlich geschützter Werke zum Training von KI-Modellen eine urheberrechtlich relevante Vervielfältigung darstellt. Dies könnte weitreichende Folgen für die weitere Nutzbarkeit von KI-Systemen haben. ([heise.de][2])

In Deutschland gibt es derzeit keine ausdrückliche Regelung, die es KI-Unternehmen erlaubt, urheberrechtlich geschützte Werke ohne Zustimmung der Rechteinhaber zu nutzen. Die bestehende Schrankenregelung für Text- und Data-Mining erlaubt zwar die Nutzung von geschützten Werken zu Forschungszwecken, jedoch nicht für kommerzielle Zwecke wie das Training von KI-Systemen. ([kulturrat.de][3])

Fazit

Obwohl keine genaue Zahl genannt werden kann, deutet die geringe direkte Vergütung für die Arbeit von Autor:innen im Vergleich zum Gesamtumsatz der Branche sowie die unrechtmäßige Nutzung ihrer Werke zum KI-Training auf einen erheblichen finanziellen Schaden hin. Eine genaue Zahl in Euro lässt sich jedoch ohne weitere spezifische Daten nicht beziffern.

[1]: https://www.netzwerk-autorenrechte.de/stellungnahme_ki.html?utm_source=c... "NETZWERK AUTORENRECHTE"
[2]: https://www.heise.de/news/Studie-fuer-Rechteinhaber-KI-Training-ist-Urhe... "Studie für Rechteinhaber: KI-Training ist Urheberrechtsverletzung​ | heise online"
[3]: https://www.kulturrat.de/presse/pressemitteilung/kuenstliche-intelligenz... "Künstliche Intelligenz und Urheberrecht | Deutscher Kulturrat"

Sandra Uschtrin:

»Versuche es dennoch.«

ChatGPT-Antwort: 

»Okay, wir nähern uns dem Thema mit einer plausiblen Schätzung, basierend auf bekannten Zahlen, Marktvolumen und üblichen Lizenzwerten.

Grundlage: Zahl der betroffenen Werke

Laut verschiedenen Recherchen, etwa durch The Atlantic oder Spiegel, waren in großen KI-Trainingsdatensätzen wie Books3 oder Common Crawl Millionen von urheberrechtlich geschützten Werken enthalten – darunter auch viele deutschsprachige Titel. Konservativ geschätzt:

- 200.000 deutschsprachige Werke könnten in solchen Sets enthalten sein (Belletristik, Sachbücher, Fachtexte etc.)
- Davon nehmen wir an, dass rund 50.000 Werke klar urheberrechtlich geschützt und von professionellen Autor:innen stammen, deren Rechte verletzt wurden.

Übliche Lizenzkosten

Die Vergütung für Textnutzung durch Verwertungsgesellschaften (z. B. VG Wort) oder direkte Lizenzen kann stark schwanken. Für maschinelles Text- und Data-Mining in kommerziellem Kontext (etwa durch OpenAI oder Google) würde ein fairer Lizenzpreis für ein ganzes Buch realistisch bei **50 bis 500 € pro Titel** liegen – je nach Umfang, Nutzung und Exklusivität.

- Wir rechnen mit einem Durchschnittswert von 250 € pro Werk als realistische Lizenzgebühr für einmalige Nutzung zum KI-Training.

Grobe Schadensschätzung

50.000 betroffene Werke × 250 € Lizenzwert = 12.500.000 €

Zusätzliche Faktoren

  • Folgeschäden: z. B. Marktverdrängung durch KI-generierte Bücher, Honorarausfälle, Rechtskosten.
  • Wertschöpfung auf Basis gestohlener Werke: KI-Unternehmen erzielen Milliardenumsätze (OpenAI 2024: >2 Mrd. $ Umsatz), zum Teil mit Systemen, die mit urheberrechtlich geschütztem Text trainiert wurden.
  • Berücksichtigt man diese Faktoren, kann der tatsächliche wirtschaftliche Schaden der deutschsprachigen Autor:innen auf 20 bis 30 Millionen Euro steigen – allein durch entgangene Lizenzen, Nutzung und Marktverzerrung.

Schlussfolgerung

Eine realistische Schätzung des direkten finanziellen Schadens für deutschsprachige Autorinnen und Autoren durch KI-Training mit ihren Werken liegt bei etwa 12 bis 30 Millionen Euro.
Diese Zahl basiert auf konservativen Annahmen über Werkzahl und faire Lizenzpreise – sie könnte steigen, wenn der Markt weiter wächst oder mehr Werke betroffen sind.

Wenn du willst, kann ich die Berechnung noch feiner aufschlüsseln oder konkrete Namen/Bücher aus den geleakten Trainingssets heraussuchen.«

Sandra Uschtrin:

»Ja bitte, werde noch konkreter.

ChatGPT-Antwort:

»Hier eine detaillierte, nachvollziehbare Schätzung des finanziellen Schadens, den deutschsprachige Autor:innen durch die unrechtmäßige Nutzung ihrer Werke zum Training von Künstlicher Intelligenz erlitten haben könnten.

1. Anzahl der betroffenen Werke

Das Books3-Dataset, eine Sammlung von etwa 200.000 E-Books, wurde unter anderem aus illegalen Quellen wie Bibliotik, Z-Library und Sci-Hub zusammengestellt. Obwohl die genaue Anzahl der deutschsprachigen Werke nicht öffentlich bekannt ist, lässt sich anhand der ISBN-Daten eine Schätzung vornehmen. Ein GitHub-Repository enthält eine Liste von 131.402 ISBNs, die in Books3 enthalten sein sollen . Wenn wir davon ausgehen, dass etwa 5 % dieser Werke deutschsprachig sind, ergibt sich eine Zahl von rund 6.570 deutschsprachigen Titeln.
github.com+1rettighedsalliancen.com+1

2. Lizenzwert pro Werk

Die Lizenzgebühren für die Nutzung eines Buches zum Training von KI-Modellen variieren je nach Umfang und Verwendungszweck. Für eine einmalige Nutzung zum Training eines KI-Modells könnte eine durchschnittliche Lizenzgebühr von 250 € pro Werk realistisch sein.

3. Gesamtschaden durch entgangene Lizenzen

Multipliziert man die Anzahl der betroffenen Werke mit dem durchschnittlichen Lizenzwert, ergibt sich folgender Schaden:

6.570 Werke × 250 € = 1.642.500 €

Dieser Betrag stellt den direkten finanziellen Verlust durch entgangene Lizenzgebühren dar.

4. Weitere Faktoren

Neben den direkten Lizenzgebühren gibt es weitere Faktoren, die den finanziellen Schaden erhöhen könnten:
- Marktverdrängung: KI-generierte Texte könnten die Nachfrage nach menschlich verfassten Werken verringern.
- Folgeschäden: Verlust von Einnahmen durch reduzierte Buchverkäufe oder Honorare.
- Rechtskosten: Kosten für rechtliche Schritte zur Durchsetzung der Urheberrechte.

Diese Faktoren könnten den finanziellen Schaden erheblich erhöhen, jedoch ist eine genaue Quantifizierung ohne spezifische Daten schwierig.

Fazit

Auf Basis der verfügbaren Daten lässt sich ein direkter finanzieller Schaden von mindestens 1,64 Millionen Euro für deutschsprachige Autor:innen schätzen, die durch die unrechtmäßige Nutzung ihrer Werke zum Training von KI-Modellen betroffen sind. Berücksichtigt man zusätzliche Faktoren wie Marktverdrängung und Folgeschäden, könnte der tatsächliche Schaden deutlich höher ausfallen.

Diese Schätzung basiert auf öffentlich verfügbaren Informationen und Annahmen, die einer weiteren Validierung bedürfen.«

Auf eine zweite, identische Abfrage antwortet ChatGPT so (2. Abfrage):

ChatGPT gibt auf komplexere Fragen nie dieselbe Antwort. Daher hier eine 2. Abfrage, in der die KI zu einem anderen Ergebnis kommt:

»Die genaue Höhe des finanziellen Schadens, den deutschsprachige Autorinnen und Autoren durch das „Diebstahl“-Problem von Urheberrechten im Kontext von Künstlicher Intelligenz (KI) erlitten haben, ist schwierig exakt zu beziffern, da es noch keine detaillierten und umfassend geprüften Zahlen dazu gibt. Es ist jedoch möglich, eine grobe Schätzung vorzunehmen, die auf den verfügbaren Informationen basiert.

Hintergrund:
Wenn KI-Modelle wie GPT-3 oder andere auf großen Textkorpora trainiert werden, beinhalten diese oft auch urheberrechtlich geschützte Werke. Wenn Autoren ihre Texte ohne eine entsprechende Lizenz zur Verfügung stellen müssen oder ohne Entschädigung in den Trainingsprozess einfließen, stellt dies einen finanziellen Schaden dar. Dies betrifft vor allem Werke, die in digitaler Form verfügbar sind und ohne Zustimmung für das Training verwendet werden.

Schätzungsweise Berechnung des Schadens:

1. Größe des Textkorpus:
Große KI-Modelle benötigen Milliarden von Wörtern, die sie aus Texten extrahieren. Schätzungen zu den Textmengen, die etwa GPT-3 für sein Training verwendet hat, gehen von etwa 570 GB an Textdaten aus. Das umfasst eine Vielzahl an Quellen, darunter Bücher, Webseiten, Zeitungsartikel und wissenschaftliche Arbeiten.

2. Wert eines Buches oder einer schriftlichen Quelle:
Der Wert eines einzelnen Werkes, wenn es lizenziert werden müsste, lässt sich nur schwer pauschalisieren, da dies stark von der Art des Werkes abhängt (ob es sich um ein Bestseller-Buch, einen Fachartikel oder ein weniger populäres Werk handelt). Ein grober Schätzwert für ein lizenziertes Buch könnte zwischen 1.000 € und 5.000 € pro Text liegen, wenn man die Lizenzgebühren und den Aufwand für den Erwerb von Nutzungsrechten in Betracht zieht.

3. Anzahl der betroffenen Werke:
Die genaue Zahl der betroffenen Werke, die in den Trainingsdaten verwendet wurden, ist ebenfalls nicht öffentlich zugänglich. Angenommen, KI-Modelle haben mindestens 100.000 deutschsprachige Bücher oder Artikel zum Training verwendet.

Schätzung des finanziellen Schadens:

Wenn 100.000 Werke verwendet wurden und der Lizenzwert für jedes Werk bei etwa 2.000 € liegt, ergibt sich: 100.000 Werke × 2.000 € = 200.000.000 €

Fazit:
Es lässt sich schätzen, dass der finanzielle Schaden für deutschsprachige Autoren im Kontext der Nutzung ihrer Werke für das Training von KI-Modelle bei ca. 200 Millionen Euro liegen könnte. Dies basiert auf der Annahme, dass jedes Werk eine Lizenzgebühr von etwa 2.000 € erfordert und mindestens 100.000 Werke verwendet wurden. Diese Zahl ist jedoch stark hypothetisch und kann je nach Umfang der tatsächlichen Nutzung und dem tatsächlichen Wert der Werke variieren.«

Und zu welchem Ergebnis kommen die Profis aus der Buchbranche? Wir dürfen gespannt sein. Sicher ist allerdings: Die Rechtskosten, um die entgangenen Gelder einzuklagen, dürften erheblich sein.

Blogbild: Illustration: Carola Vogt