Sie sind hier

Suchformular

Tipps von der Authors Guild zum Schutz vor KI und dem Webcrawler GPTBot

Branchen-News
Sandra Uschtrin
Tipps von der Authors Guild für Autoren zum Schutz ihrer Werke vor KI-Nutzung

Die Authors Guild erklärt Autor:innen auf ihrer Website, wie sie den Zugriff des Webcrawlers von OpenAI – GPTBot – auf ihren Websites blockieren können. Außerdem gibt die Authors Guild Tipps, wie sich Autor:innen gegen unautorisierte Trainingsanwendungen zur Weiterentwicklung von Künstlicher Intelligenz (KI) schützen können.

Die Authors Guild erklärt Autor:innen auf ihrer Website, wie sie den Zugriff des Web-Crawlers von OpenAI auf ihren Websites blockieren können. Außerdem gibt sie Tipps, wie sie sich gegen unautorisierte Trainingsanwendungen zur Weiterentwicklung von Künstlicher Intelligenz (KI) schützen können.

Die Authors Guild erklärt in einem Artikel vom 8. September 2023, wie das funktioniert. Im Folgenden die Übersetzung:

Textbasierte generative KI-Technologien erfordern die Aufnahme riesiger Datenmengen, darunter zehn- oder hunderttausende von Büchern. Die KI-Unternehmen haben die Autor:innen, deren Bücher und andere Schriften für das Training generativer KI-Technologien verwendet werden, bisher weder um Erlaubnis gefragt noch ihnen eine Entschädigung angeboten – eine Praxis, die die Authors Guild strikt ablehnt. Erschwerend kommt hinzu, dass alle großen Buch-KI-Trainingsdatensätze, von denen wir wissen, von E-Book-Piraterie-Seiten zusammengestellt wurden – eben weil es keine legalen Datenbanken mit Büchern im offenen Internet gibt und die KI-Entwickler keine Lizenzen dafür erworben haben.

Die Authors Guild hat sich für gesetzliche und regulatorische Änderungen eingesetzt, die KI-Unternehmen dazu verpflichten würden, eine Genehmigung einzuholen, bevor sie Bücher und andere schriftliche Werke für das Training und die Entwicklung generativer KI-Systeme verwenden. Solange jedoch keine gesetzlichen Schutzmaßnahmen eingeführt sind, können Autoren einige Schritte unternehmen, um sich vor einer nicht genehmigten Nutzung zu Trainingszwecken zu schützen.

Stellen Sie zunächst sicher, dass Sie Google-Alerts für jedes Ihrer Bücher einrichten und Benachrichtigungen senden, wenn Sie unerlaubte Kopien online sehen. Darüber hinaus empfehlen wir Ihnen, einen kurzen Hinweis auf dem Umschlag oder der Copyright-Seite Ihrer Bücher oder am Anfang der veröffentlichten Artikel oder Geschichten anzubringen. Obwohl das Urheberrecht den Autoren das ausschließliche Recht einräumt, über die Nutzung ihrer Werke durch andere zu entscheiden, sind viele Technologieunternehmen, darunter auch KI-Entwickler, der Meinung, dass alles im Internet frei genutzt werden kann. Sie werden sich jedoch an die Opt-outs halten, wenn sie dazu aufgefordert werden. Nachstehend finden Sie ein Beispiel für einen solchen Hinweis:

KEIN KI-TRAINING: Ohne die ausschließlichen Rechte des Autors [und des Herausgebers] nach dem Urheberrecht in irgendeiner Weise einzuschränken, ist jede Verwendung dieser Veröffentlichung zum »Trainieren« generativer Technologien der künstlichen Intelligenz (KI) zur Erzeugung von Text ausdrücklich verboten. Der Autor behält sich alle Rechte zur Lizenzierung der Nutzung dieses Werks für generatives KI-Training und die Entwicklung von Sprachmodellen für maschinelles Lernen vor.

Webcrawler GPTBot von OpenAI

Darüber hinaus können Sie sich vor unbefugtem Crawling und Scraping von Text auf Ihrer Website schützen, indem Sie eine Datei namens robots.txt mit Anweisungen für Webcrawler hinzufügen oder bearbeiten. OpenAI hat erklärt, dass es Websites nicht crawlen wird, die seinen Crawler, GPTBot, in der robots.txt-Datei einschränken.

Hier erfahren Sie, wie Sie Ihre robots.txt-Datei hinzufügen oder aktualisieren können (1). Und OpenAI bietet Details dazu, wie Sie GPTBot den Zugriff auf Ihre Website verweigern können (2). Schließlich können Sie mit dem robots.txt-Tool von Google überprüfen, ob die aktualisierte Datei mit der Dokumentation übereinstimmt (3).

1.    https://developers.google.com/search/docs/crawling-indexing/robots/submit-updated-robots-txt?hl=de
2.    https://platform.openai.com/docs/gptbot
3.    https://www.google.com/webmasters/tools/robots-testing-tool

Über die Authors Guild

Mit mehr als 13.000 Mitgliedern ist die Authors Guild die älteste und größte Berufsorganisation für veröffentlichte Autoren in den USA.

Blogbild: Gerd Altmann, Pixabay