Title
Urteil: Text- und Datamining für KI-Training
Ein Berufsfotograf hatte gegen den LAION e.V. geklagt, einen gemeinnützigen Verein, der u.a. den sog. LAION-5B-Datensatz mit 5,85 Milliarden Bild-Text-Paaren unter einer Open Source-Lizenz für Machine-Learning, also für KI-Trainingszwecke, zur Verfügung stellt.
In diesem Datensatz sind die Bilder und zugehörigen Beschreibungen indessen nicht selbst gespeichert, sondern lediglich verlinkt. Die Bild-URLs hatte LAION zuvor aus einem anderen Datensatz übernommen und die Bilder vorübergehend von den Originalwebsites heruntergeladen, um automatisiert zu überprüfen, ob Bild- und Textinhalte übereinstimmten. Bei Übereinstimmung wurden (nur) die Bild-URLs und Beschreibungen als Metadaten in den neuen LAION-5B-Datensatz übernommen.
Bei diesem Prüfvorgang war auch ein mit Wasserzeichen geschütztes Bild des Klägers von einer Stockfotoplattform, mit der der Kläger zusammenarbeitet, heruntergeladen worden. Die Nutzungsbedingungen der Stockfotoplattform untersagten automatisiertes Scraping („bots or the like“) ausdrücklich.
Der Kläger sah sich durch den Download seines Bildes in seinem Urheberrecht verletzt und klagte gegen den LAION e.V. auf Unterlassung. Das Landgericht Hamburg wies die Klage in erster Instanz mit der Begründung ab, dass die erfolgte Vervielfältigung durch die Schrankenbestimmungen der §§ 44b und 60d UrhG gedeckt sein (Urt. v. 27. September 2024, Az. 310 O 227/23).
Hiergegen legte der Kläger Berufung ein und verlor. Auch das OLG Hamburg sah den urheberrechtlichen Eingriff (Vervielfältigung durch Download) durch die urheberrechtlichen Schrankenbestimmungen der §§ 60d und 44b UrhG gedeckt.
Diese Normen erlauben die Vervielfältigung urheberrechtlich geschützter Werke, wenn sie zur automatisierten Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken erfolgt, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen (=Text- und Data-Mining) und sofern die betreffenden Dateien nicht mit einem maschinenlesbaren Nutzungsvorbehalt verwehen sind.
Diese Voraussetzungen hielt das OLG Hamburg vorliegend für erfüllt, weil der Download zum Abgleich von Bildinhalten mit zugehörigen Beschreibungstexten erfolgt sei. Zur Begründung verwies der Senat auch auf das Unionsrecht: Art. 53 Abs. 1 lit. c KI-VO verweise ausdrücklich auf die Text- und Data-Mining-Schranke in Art. 4 DSM-RL, in deren Umsetzung die §§ 44b und 60d UrhG normiert worden seien. Daraus folge, dass diese Schranke ausdrücklich auch für maschinelles Lernen und das Training von KI-Modellen anwendbar sei.
Bei der AGB-Klausel der Stockfotoplattform (Scraping-Verbot) handele es sich nicht um einen die Zulässigkeit des Downloads ausschließenden Nutzungsvorbehalt im Sinne des § 44b Abs. 3 UrhG. Der Kläger habe nicht hinreichend dargelegt, dass dieser Vorbehalt in Textform von automatisierten Systemen erkannt und verarbeitet werden könne, also „maschinenlesbar“ sei.
Das Urteil des OLG Hamburg widerspricht dem Urteil des Landgerichts München im Verfahren GEMA ./. OpenAI nur scheinbar. Während es in dem Verfahren vor dem LG München vor allem um die Memorisierung konkreter Songtexte in einem KI-Modell und den identischen Output nach Eingabe entsprechender Prompts ging, lag der Schwerpunkt im Verfahren vor dem OLG Hamburg in der Frage der urheberrechtlichen Zulässigkeit der Sammlung, Aufbereitung und Verlinkung von Trainingsdaten. Anders als im Münchener Verfahren, erfolgten die Vervielfältigungen hier rein technisch und vorübergehend für die Erstellung eines Trainingsdatensatzes, der die betreffenden Werke dann nur noch verlinkte.
Das OLG Hamburg hat die Revision zum Bundesgerichtshof zugelassen. Sollte dieser angerufen werden, ist zu erwarten, dass er die Fragen zur Reichweite der §§ 44b und 60d UrhG dem Europäischen Gerichtshof vorlegen wird.