Neue Klarheit zur urheberrechtlichen Zulässigkeit von Text und Data Mining
Mit dem Urteil des Hanseatischen Oberlandesgerichts Hamburg (Az. 5 U 104/24 vom 10. Dezember 2025) liegt eine richtungsweisende Entscheidung vor, die Unternehmen, Forschungseinrichtungen und insbesondere Technologieanbieter betrifft. Der Fall hatte erhebliche Aufmerksamkeit erregt, da er die Frage behandelte, ob die Nutzung geschützter Fotografien für das Training Künstlicher Intelligenz unter die Schrankenregelungen des Urheberrechts fällt. Diese Entscheidung schafft für die Praxis wichtige Orientierung hinsichtlich der rechtssicheren Nutzung urheberrechtlich geschützter Inhalte im Rahmen des sogenannten Text und Data Mining, kurz TDM, und der Auslegung des § 44b Urheberrechtsgesetz. Text und Data Mining bezeichnet die automatisierte Analyse digitaler Werke, um aus großen Datenmengen Muster oder Zusammenhänge zu extrahieren. Für Unternehmen, die KI-Anwendungen entwickeln oder trainieren, ist diese Methode unverzichtbar, da sie die Grundlage für das maschinelle Lernen bildet.
Hintergrund des Rechtsstreits und die Positionen der Parteien
Der Ausgangspunkt des Verfahrens war die Nutzung eines einzelnen Fotografiewerks durch einen Verein, der ein frei zugängliches Datenset für Forschung und Entwicklung erstellte. Dieses Datenset bestand aus Bild-Text-Paaren, die es ermöglichen, Zusammenhänge zwischen visuellen und sprachlichen Informationen zu trainieren. Der klagende Fotograf argumentierte, dass die Vervielfältigung seines Fotos ohne seine Zustimmung eine Verletzung seiner Rechte als Urheber darstelle. Er machte geltend, dass auch das einmalige Herunterladen der Datei und ihre maschinelle Verarbeitung in einer Datenbank eine unrechtmäßige Nutzung darstelle. Das Landgericht Hamburg hatte die Klage bereits abgewiesen, und auch das Oberlandesgericht bestätigte nun diese Auffassung. Der Senat stellte dabei klar, dass sich der Verein auf die gesetzlichen Schrankenregelungen berufen kann, die eine Nutzung zu Zwecken des TDM ausdrücklich erlauben, wenn kein maschinenlesbarer Nutzungsvorbehalt besteht. Gerade diese Anforderung an die maschinenlesbare Form nimmt eine zentrale Rolle ein, da sie den Praxisbezug zwischen technischer Umsetzung und urheberrechtlicher Zulässigkeit herstellt.
Die Begründung des Oberlandesgerichts und ihre Praxisrelevanz
Nach Auffassung des Oberlandesgerichts war die Nutzung der Fotografie zulässig, weil die gesetzlichen Voraussetzungen des § 44b erfüllt waren. Dieser Paragraph erlaubt das Kopieren geschützter Werke für Text und Data Mining, solange ein erkennbarer, maschinenlesbarer Vorbehalt der Rechteinhaber fehlt. Das Gericht führte aus, dass der auf der Webseite der Bildagentur vorhandene Hinweis nicht in der vorgeschriebenen technischen Form vorlag, wodurch die Nutzung als rechtmäßig einzustufen sei. Besonders relevant für Unternehmen und Forschungseinrichtungen ist die Auslegung des Begriffs maschinenlesbar. Hierbei genügt ein einfacher Copyright-Vermerk nicht – erforderlich ist eine technische Kennzeichnung, die automatisiert ausgelesen werden kann, etwa durch Metadaten oder standardisierte Markierungen gemäß branchenüblichen Spezifikationen. Somit entsteht eine deutliche Handlungsempfehlung für Rechteinhaber wie auch für Entwickler von KI-Systemen: Nur klare, digital erkennbare Nutzungsbeschränkungen entfalten urheberrechtliche Wirkung gegenüber automatisierten Datennutzungen.
Das Gericht ging darüber hinaus auf den Anwendungsbereich der Forschungsausnahme nach § 60d Urheberrechtsgesetz ein. Danach dürfen Werke für Zwecke der wissenschaftlichen Forschung vervielfältigt werden, wenn die Nutzung methodisch erfolgt und auf einen Erkenntnisgewinn gerichtet ist. Der Senat bejahte dies, da die Erstellung des Datensatzes als Teil angewandter Forschung anzusehen sei. Bemerkenswert ist die Feststellung, dass der Datensatz zwar auch kommerziellen Nutzern zugänglich war, dies aber nicht automatisch zu einer unzulässigen kommerziellen Verwertung führt. Maßgeblich bleibt, dass die Forschungseinrichtung unabhängig handelt und die Datenerhebung nicht von kommerziellen Interessen bestimmt wird. Diese Differenzierung ist gerade für Unternehmen mit Forschungsabteilungen von hoher Relevanz, da sie ein Gleichgewicht zwischen wissenschaftlicher Kooperation und rechtlicher Sicherheit schafft.
Fazit und Handlungsempfehlung für die Praxis
Für Unternehmen, die KI-Modelle trainieren oder Datenanalysen durchführen, ist dieses Urteil von erheblicher Tragweite. Es verdeutlicht, dass die Nutzung urheberrechtlich geschützter Werke im Rahmen von Text und Data Mining zulässig sein kann, sofern keine maschinenlesbaren Nutzungsvorbehalte existieren. Rechteinhaber wiederum sollten prüfen, ob sie ihre Werke mit solchen technischen Beschränkungen versehen, wenn sie eine Nutzung verhindern möchten. In der Praxis bedeutet dies, dass sowohl Entwickler als auch Rechteinhaber technische und juristische Maßnahmen eng verzahnen müssen. Unternehmen, insbesondere im Bereich der digitalen Transformation und datengetriebener Geschäftsmodelle, sollten ihre Prozesse prüfen, um Urheberrechtsrisiken frühzeitig zu erkennen und rechtssicher zu gestalten.
Das Urteil zeigt zugleich, dass der Gesetzgeber die Schranken für Text und Data Mining praxisorientiert gefasst hat, um Innovationen zu ermöglichen, ohne den Schutz der Urheber zu gefährden. Für Forschungseinrichtungen, aber auch für kleine und mittelständische Betriebe mit eigenen Digitalisierungsprojekten, schafft dies einen tragfähigen rechtlichen Rahmen. In unserer Kanzlei begleiten wir kleine und mittelständische Unternehmen bei der rechtlichen und prozessualen Umsetzung digitaler Strategien. Unser Schwerpunkt liegt auf der Optimierung buchhalterischer Abläufe und der Integration digitaler Werkzeuge, um Kosten zu senken und rechtssichere Prozesse sicherzustellen. Wir unterstützen Mandanten unterschiedlicher Branchen bei der Digitalisierung ihrer Geschäftsprozesse und sorgen dafür, dass technische Innovation mit rechtlicher Stabilität einhergeht.
Gerichtsentscheidung lesen