Fotograf verliert Urheberrechtsstreit über KI-Trainingsdatensatz in wegweisender Entscheidung des deutschen Gerichts

Fotograf verliert Urheberrechtsstreit über KI-Trainingsdatensatz in wegweisender Entscheidung des deutschen Gerichts

Von
Anup S
4 Minuten Lesezeit

Rechtsstreit Zwischen Fotograf und LAION Über KI-Trainingsdaten Abgewiesen

In einem aktuellen hochkarätigen Fall zwischen einem Fotografen und der gemeinnützigen Organisation LAION (Aktenzeichen 310 O 227/23) entschied das Hamburger Landgericht zugunsten von LAION und wies die Ansprüche des Fotografen wegen Urheberrechtsverletzung ab. Der Streit entstand, nachdem LAION eines der Bilder des Fotografen in ihrem weit verbreiteten "LAION-5B"-Datensatz aufgenommen hatte, einer Sammlung von 5,85 Milliarden Bild-Text-Paaren, die kostenlos für das Training von Künstlicher Intelligenz (KI) zur Verfügung steht.

LAION, eine gemeinnützige Organisation, die große Datensätze für die AI-Forschung erstellt, hatte das Bild von der Website einer Fotoagentur kopiert. Das Bild wurde mit einer Beschreibung und Metadaten (einschließlich der URL) kombiniert und in den LAION-5B-Datensatz aufgenommen. Der Fotograf verklagte LAION und behauptete, die gemeinnützige Organisation habe sein Urheberrecht verletzt, indem sie das Bild ohne Erlaubnis reproduzierte, was gegen die Nutzungsbedingungen der Fotoagentur verstieß, die automatisierte Datenbeschaffung verbot. LAION verteidigte sich und argumentierte, dass ihre Vorgehensweise unter dem deutschen Urheberrecht legal sei, insbesondere unter Bestimmungen, die Datenanalyse und Forschung für wissenschaftliche Zwecke erlauben (§§ 44b, 60d UrhG).

Das Gericht wies letztendlich die Ansprüche des Fotografen zurück und stellte fest, dass die Aktivitäten von LAION unter die Forschungsausnahme in § 60d UrhG fielen, die es gemeinnützigen Organisationen erlaubt, urheberrechtlich geschützte Werke für wissenschaftliche Forschung zu nutzen, einschließlich der Erstellung von KI-Trainingsdatensätzen.

Wichtigste Erkenntnisse:

  • Gericht entscheidet zu Gunsten von LAION: Das Hamburger Landgericht entschied zugunsten von LAION und wies die Ansprüche des Fotografen wegen Urheberrechtsverletzung ab. Der Einsatz des Bildes für den KI-Trainingsdatensatz wurde als rechtmäßig unter den Ausnahmen des deutschen Urheberrechts angesehen.
  • LAION-5B-Datensatz: Im Zentrum des Streits steht der massive „LAION-5B“-Datensatz, eine öffentliche Ressource mit 5,85 Milliarden Bild-Text-Paaren, die für das Training von KI-Modellen verwendet wird. Das Bild wurde von der Website einer Fotoagentur ohne vorherige Zustimmung des Fotografen entnommen und in den Datensatz aufgenommen.
  • Urheberrecht und KI: Der Fall hebt die sich entwickelnde Überschneidung von Urheberrecht und KI-Trainingsdatensätzen hervor, während Schöpfer und Entwickler mit den rechtlichen Grenzen der Verwendung von öffentlich zugänglichen Bildern für das Training von maschinellen Lernmodellen ringen.
  • Forschungsausnahme: LAION argumentierte erfolgreich, dass die Verwendung des Bildes unter § 60d UrhG geschützt ist, der die Reproduktion urheberrechtlich geschützter Werke für wissenschaftliche Forschung durch gemeinnützige Organisationen erlaubt.

Tiefere Analyse: Dieses Urteil beleuchtet die wachsenden rechtlichen Komplexitäten im Bereich KI, Urheberrecht und die faire Nutzung digitaler Inhalte. LAION, das 2021 gegründet wurde, konzentriert sich auf die Erstellung riesiger Datensätze für öffentliche und wissenschaftliche Zwecke, die es Forschern der KI ermöglichen, Modelle mit großen Mengen an realen Daten zu trainieren. Der „LAION-5B“-Datensatz, der im Mittelpunkt des Falls steht, ist einer der größten öffentlich verfügbaren KI-Trainingsdatensätze und wird häufig bei der Entwicklung generativer KI-Modelle genutzt.

Der Kläger, ein Fotograf, behauptete, dass LAION sein Urheberrecht verletzt habe, indem sie sein Bild von der Website einer Fotoagentur kopierte. Das Bild wurde im KI-Trainingsprozess der gemeinnützigen Organisation verwendet, was das Herunterladen des Bildes, die Kombination mit einer Beschreibung und die Aufnahme in den Datensatz beinhaltete. Der Kläger behauptete, dies stelle eine unrechtmäßige Reproduktion seines Werkes nach § 16 UrhG dar, der Schöpfer vor unautorisierten Kopien ihrer Werke schützt.

Im Gegenzug verwies LAION auf rechtliche Bestimmungen des deutschen Urheberrechts, speziell § 44b UrhG, das Text- und Datenanalysen erlaubt, und § 60d UrhG, das gemeinnützigen Organisationen erlaubt, urheberrechtlich geschützte Werke für wissenschaftliche Forschung zu reproduzieren. Das Gericht befand, dass der Datensatz von LAION, der für das Training von KI-Systemen verwendet wurde, als wissenschaftliches Vorhaben qualifiziert war, und dass ihre Nutzung des Bildes legal war. Während der Fotograf Bedenken hinsichtlich der möglichen kommerziellen Auswirkungen solcher Datensätze äußerte, betonte das Gericht, dass die Arbeit von LAION im Rahmen der nicht-kommerziellen Forschung blieb.

Die Auswirkungen dieses Falls sind erheblich für die KI-Branche, insbesondere da generative KI immer fortschrittlicher wird und Datensätze wie LAION-5B unerlässlich für das Training groß angelegter Modelle sind. Die Bedenken des Fotografen spiegeln breitere Ängste in der Kreativgemeinschaft wider: dass KI-Modelle, die auf urheberrechtlich geschützten Werken trainiert werden, letztlich Inhalte produzieren könnten, die mit menschlichen Schöpfern konkurrieren. Das Urteil deutet jedoch darauf hin, dass die aktuellen rechtlichen Rahmenbedingungen dazu neigen, wissenschaftliche Forschung und technologische Fortschritte, insbesondere in nicht-kommerziellen Kontexten, zu priorisieren.

Dieser Fall wirft auch Fragen zum Umfang von § 44b UrhG auf, der Text- und Datenanalysen regelt. Der Kläger argumentierte, dass das Gesetz nicht dafür gedacht sei, KI-Scraping abzudecken, das urheberrechtlich geschützte Werke als Trainingsmaterial verwendet. Das Gericht musste jedoch diesen Punkt nicht vollständig ansprechen, da es die Aktivitäten von LAION unter den umfassenderen Forschungsbestimmungen von § 60d UrhG als ausgenommen befand.

Wussten Sie schon? Der LAION-5B-Datensatz, der im Zentrum dieses Rechtsstreits steht, ist einer der größten Datensätze seiner Art weltweit. Er umfasst 5,85 Milliarden Bild-Text-Paare und ist kostenlos zugänglich und wird von Forschern und Entwicklern intensiv genutzt, um KI-Modelle für Anwendungen in der Computer Vision, der Verarbeitung natürlicher Sprache und generativen KI-Technologien zu trainieren. Besonders wichtig sind Datensätze wie LAION-5B für die Entwicklung großer Sprachmodelle (LLMs) und Text-zu-Bild-Generierungstools, wie sie in bekannten Anwendungen wie DALL-E und Stable Diffusion verwendet werden.

Der Datensatz wird durch das Scraping öffentlich verfügbarer Bilder aus dem Internet erstellt und mit beschreibendem Text kombiniert, wodurch Forschern eine umfangreiche Ressource für das KI-Training zur Verfügung steht. Doch wie in diesem Fall zu sehen ist, bleibt der rechtliche Status dieser Datensätze ein heiß umstrittenes Thema, insbesondere, da KI-Modelle immer ausgeklügelter werden und in der Lage sind, Inhalte zu produzieren, die mit menschlicher Kreativität konkurrieren.

Das könnte Ihnen auch gefallen

Dieser Artikel wurde von unserem Benutzer gemäß den Regeln und Richtlinien für die Einreichung von Nachrichten. Das Titelbild ist computererzeugte Kunst nur zu illustrativen Zwecken; nicht indikativ für den tatsächlichen Inhalt. Wenn Sie glauben, dass dieser Artikel gegen Urheberrechte verstößt, zögern Sie bitte nicht, dies zu melden, indem Sie uns eine E-Mail senden. Ihre Wachsamkeit und Zusammenarbeit sind unschätzbar, um eine respektvolle und rechtlich konforme Community aufrechtzuerhalten.

Abonnieren Sie unseren Newsletter

Erhalten Sie das Neueste aus dem Unternehmensgeschäft und der Technologie mit exklusiven Einblicken in unsere neuen Angebote