In einem Urteil, das dazu beitragen könnte, die Grenzen von KI-Training und Urheberrecht zu definieren, hat Richterin Colleen McMahon vom Southern District of New York die Klage von Raw Story Media und AlterNet Media gegen OpenAI wegen Urheberrechtsverletzung abgewiesen. Diese Entscheidung vom November 2024 gibt wichtige Einblicke in die Art und Weise, wie Gerichte die Überschneidung von KI-Entwicklung und Urheberrechtsschutz angehen können.
Der Fall auf einen Blick
Raw Story und AlterNet, zwei unabhängige Nachrichtenorganisationen, reichten im Februar 2024 Klage gegen OpenAI ein und behaupteten, das Unternehmen habe ihre urheberrechtlich geschützten Nachrichtenartikel unrechtmäßig zum Training seiner großen Sprachmodelle (LLMs) verwendet. Der Fall reiht sich ein in eine wachsende Zahl von Klagen gegen die Trainingspraktiken von KI-Unternehmen, einschließlich ähnlicher Klagen von Autoren und Nachrichtenorganisationen.
Hauptargumente und Analyse des Gerichts
1. Direkte Verletzung des Urheberrechts
Die Kläger argumentierten, dass OpenAI ihre Urheberrechte direkt verletzte, indem es ihre Artikel in Trainingsdatensätze kopierte. Das Gericht befand diese Behauptung jedoch als unzureichend, da die Kläger es versäumten:
- konkrete urheberrechtlich geschützte Werke zu benennen, die angeblich verletzt wurden
- diese Werke vor Einreichung der Klage beim Copyright Office zu registrieren
- das tatsächliche Kopieren durch OpenAI nachzuweisen
2. The Output Question
Ein faszinierender Aspekt der Analyse des Gerichts betraf die Frage, ob die Ergebnisse von ChatGPT eine Urheberrechtsverletzung darstellen könnten. Die Kläger behaupteten, dass die KI den Inhalt ihrer Artikel reproduzieren könnte, aber Richter McMahon hielt dieses Argument für spekulativ und nicht durch konkrete Beispiele gestützt.
3. Stellvertretende und mitwirkende Rechtsverletzung
Das Gericht wies auch die Klagen wegen sekundärer Rechtsverletzung ab und stellte fest, dass die Klägerinnen keine unmittelbare Rechtsverletzung durch Dritte festgestellt haben, die OpenAI erleichtert oder gefördert haben könnte.
Weiterreichende Auswirkungen
Dieses Urteil hat mehrere wichtige Auswirkungen auf die KI-Branche und die Urheber von Inhalten:
- Rechtfertigungsgründe: Die Entscheidung legt die Messlatte für Kläger in KI-Urheberrechtsfällen hoch. Die bloße Behauptung, dass der Inhalt wahrscheinlich für Schulungszwecke verwendet wurde, reicht nicht aus - es müssen konkrete Werke und Registrierungen genannt werden.
- Analyse von Trainingsdaten: Die Analyse des Gerichts deutet darauf hin, dass die bloße Aufnahme von urheberrechtlich geschütztem Material in Trainingsdatensätze nicht automatisch eine Rechtsverletzung darstellt, obwohl diese Frage nicht endgültig geklärt wurde.
- Output-basierte Ansprüche: Das Urteil zeigt Skepsis gegenüber Behauptungen, die auf der theoretischen Fähigkeit beruhen, Inhalte zu reproduzieren, ohne konkrete Beispiele für eine solche Reproduktion.
Insgesamt deutet die Betonung des Gerichts auf spezifische, konkrete Beweise für eine Rechtsverletzung darauf hin, dass in künftigen Fällen der Schwerpunkt eher auf nachweisbarem Schaden als auf theoretischen Möglichkeiten liegen sollte.
Warum Raw Story in der EU wahrscheinlich Erfolg haben würde: Eine rechtliche Analyse
In der Europäischen Union würde die Klage von Raw Story gegen OpenAI wahrscheinlich ganz anders ausgehen, auch wenn ein „Sieg“ ganz anders aussehen könnte als das, was wir im US-System üblicherweise unter einem Gerichtssieg verstehen. Hier ist der Grund dafür:
Automatische Rechte und Klagebefugnis
Erstens würde Raw Story die ersten Hürden nehmen, die sich im US-Fall als fatal erwiesen. Nach EU-Recht, insbesondere Artikel 15 der DSM-Richtlinie, haben Presseverleger automatisch zwei Jahre lang nach der Veröffentlichung Rechte an ihren Inhalten. Es gibt keine Registrierungspflicht, und die bloße Tatsache der Veröffentlichung reicht aus, um eine Klage einzureichen.
Umkehrung der Beweislast
Der entscheidende Unterschied liegt in der Beweislast. In der EU würde sich die Beweislast auf OpenAI verlagern, sobald Raw Story nachweist, dass es sich um einen Nachrichtenverlag handelt, dessen Inhalte potenziell für Schulungszwecke verwendet werden:
- Sie haben den Inhalt nicht verwendet
- Sie verfügten über ordnungsgemäße Lizenzen
- Sie haben sich an die Opt-out-Mechanismen gehalten
- Sie hatten die erforderlichen technischen Maßnahmen durchgeführt
Vermutung des Schutzes
Anders als im US-Fall, in dem Raw Story konkrete Fälle des Kopierens nachweisen musste, würde das EU-Recht davon ausgehen, dass systematisches Web-Scraping für das KI-Training bis zum Beweis des Gegenteils wahrscheinlich auch Nachrichteninhalte umfasst. Allein diese Vermutung würde OpenAI wahrscheinlich zu einem Vergleich oder einer Lizenzvereinbarung zwingen.
Unterschiedliche Definition von „Sieg“
Das Ergebnis wäre jedoch nicht unbedingt ein traditioneller „Sieg“ im Sinne von Schadenersatz für frühere Verstöße. Stattdessen wäre das wahrscheinliche Ergebnis Folgendes:
- Obligatorische Lizenzierungsvereinbarung
- Strukturierter Vergütungsrahmen
- Laufende Zahlungsmechanismen
- Nutzungsverfolgung
- Regelmäßige Berichtspflichten
Warum das wichtig ist
Der EU-Ansatz verwandelt das, was in den USA ein Fall von Urheberrechtsverletzung wäre, in eine Angelegenheit, die eher mit der Einhaltung von Vorschriften zu tun hat. Dies spiegelt die allgemeine Philosophie der EU wider, dass die Entwicklung von KI innerhalb eines strukturierten Rechtsrahmens erfolgen sollte, der die Rechte der verschiedenen Interessengruppen von Anfang an schützt, anstatt Konflikte im Nachhinein durch Rechtsstreitigkeiten zu lösen.
Gehen Sie mit KI in die Zukunft Ihres Unternehmens
Mit unseren KI-Workshops rüsten Sie Ihr Team mit den Werkzeugen und dem Wissen aus, um bereit für das Zeitalter der KI zu sein.