Urheberrechtsstreit mit OpenAI und Microsoft
New York Times reicht Klage ein
Die The New York Times Company, das Unternehmen hinter der traditionsreichen Zeitung „The Times“, hat am 27. Dezember eine Klage am Bezirksgericht Südliches New York eingereicht. Beklagte sind die Microsoft Corporation sowie acht Unternehmen von Open AI, dem Betreiber von ChatGPT. Gegenstand der Klage sind vermeintliche Urheberrechtsverletzungen seitens OpenAI und Microsoft zu Lasten der Klägerin New York Times. Es geht im Kern um die unbefugte und unlizensierte Nutzung urheberrechtlich geschützter Inhalte beim Trainieren der Sprachmodelle von OpenAI. Am Ende droht eine Löschung der Sprachmodelle und Trainingsdaten sowie eine gigantische Strafzahlung in Millardenhöhe. Nur allein im Fall der Klägerin New York Times.
Die Dimension hinter der Klage, die symptomatisch für den seit längerem schwelenden Urheberrechtsstreit rund um die Generative Künstliche Intelligenz steht, ist noch viel gewaltiger. Und so erklärt sich auch die hektische Betriebsamkeit der Lobbyisten in den letzten Wochen, denen es gelungen war, immer mehr Politiker zu aktivieren, die das Urheberrecht in teils sehr verwegenen Einlassungen als veraltet gebrandmarkt haben, als Innovationsbremse und als Standortnachteil. Allen Beteiligten ist klar, dass hier ein Handlungsbedarf besteht, denn allzu leichtfertig scheinen sich die KI-Entwickler an geschützten Inhalten bedient zu haben. Doch mittlerweile ist die Generative Künstliche Intelligenz -von ChatGPT bis Midjourney- ein kommerzielles Produkt und tritt durchaus in Konkurrenz mit dem Onlineangebot der New York Times und anderen Publishern und Rechteinhabern. Dies zumindest arbeitet die Klageschrift detailliert heraus. Und mit der „The Times“ klagt nun ein Medienhaus, dass nachweislich profitable Geschäftsmodelle in den Zeiten des großen, internetbedingten, Medienumbruchs für sich etabliert hat. Und damit auch einen faktischen Vermögensschaden durch Urheberrechtsverletzungen befürchten kann und muss.
Eine weitere Besonderheit der Klageschrift, die wir Ihnen im Original zum Download bereitstellen und in Auszügen in deutscher Übersetzung analysieren, ist die Rolle von Microsoft. Die Klagebegründung zielt gleich an mehreren Stellen auf die Rolle des OpenAI-Großgesellschafters aus Redmond ab. Sei es als technischer Cloud-Dienstleister oder eben auch als Betreiber der Suchmaschine Bing, deren Index immer stärker durch ChatGPT genutzt wird. Laut Klage in einem Umfang, der die üblichen Teaser-Ergebnisse in Suchmaschinen weit übertrifft. Die New York Times alleine beklagt und behauptet, dass Millionen ihrer Artikel durch den Chatbot und bei dessen Training verwendet wurden und werden. Sie fordert Unterlassung, Löschung und Entschädigung. Umfang und Höhe der Ansprüche sollen in einem Schwurgerichtsverfahren geklärt werden. Angesichts der großen Menge an möglichen Urheberrechtsverletzungen kann sich die Summe der Strafzahlungen auf einen hohen Milliardenbetrag belaufen. Noch bedrohlicher für OpenAI und andere KI-Betreiber, die weitere Klagen fürchten müssten, wäre eine gerichtliche Auflage die derzeitigen Sprachmodelle und Trainingsdaten zu vernichten.
Schlüsselstellen der Klage
Die New York Times führt an, früh das Gespräch mit den Beklagten gesucht zu haben. Seitz April soll es Gespräche gegeben haben – jedoch ohne gütliche Einigung und eine zukunftsweisende Lösung. Denn das ist der Knackpunkt. Wie können Produzenten von geschützten Inhalten und Betreiber von KI-Lösungen in Zukunft gemeinsam profitieren und zu einer befriedigenden kommerziellen Vertragsvereinbarung. OpenAI wiederum bestätigt zwar diese Gespräche, zeigt sich jedoch überrascht und enttäuscht über die Klage, da man die Erfolgsaussichten der Verhandlungen deutlich positiver bewertet.
Nachfolgend haben wir einige Schlüsselstellen der 69-seitigen Klageschrift für Sie herausgegriffen:
„Die rechtswidrige Nutzung der Arbeit der Times durch die Beklagten zur Entwicklung von Produkten der künstlichen Intelligenz, die mit der Times konkurrieren, bedroht die Fähigkeit der Times, ihre Dienste anzubieten. Die Werkzeuge der Beklagten für Generative Künstliche Intelligenz ("GenAI") stützen sich auf große Sprachmodelle ("LLM"), die durch das Kopieren und Verwenden von Millionen von urheberrechtlich geschützten Nachrichtenartikeln, ausführlichen Recherchen, Meinungsbeiträgen, Rezensionen, Anleitungen -und mehr- der Times erstellt wurden. Während die Beklagten in großem Umfang aus vielen Quellen kopierten, legten sie bei der Erstellung ihrer LLMs besonderen Wert auf die Inhalte der Times - ein Zeichen für den Wert dieser Werke. Durch Microsofts Bing Chat (kürzlich in "Copilot" umbenannt) und OpenAIs ChatGPT versuchen die Beklagten, die massiven Investitionen der Times in ihren Journalismus auszunutzen, indem sie die Werke ohne Erlaubnis oder Bezahlung für die Entwicklung von Ersatzprodukten verwenden. (…) Die Beklagten haben sich geweigert, diesen Schutz anzuerkennen. Angetrieben von LLMs, die Kopien von Times-Inhalten enthalten, können die GenAI-Tools der Beklagten eine Ausgabe erzeugen, die Times-Inhalte wortwörtlich rezitiert, sie eng zusammenfasst und ihren Ausdrucksstil nachahmt, wie zahlreiche Beispiele zeigen. Diese Tools schreiben der Times auch fälschlicherweise unrichtige Informationen zu. Die Beklagten verwenden auch den Bing-Suchindex von Microsoft, der die Online-Inhalte der Times kopiert und kategorisiert, um Antworten zu generieren, die wörtliche Auszüge und detaillierte Zusammenfassungen von Times-Artikeln enthalten, die wesentlich länger und detaillierter sind als die von herkömmlichen Suchmaschinen zurückgegebenen. Durch die Bereitstellung von Times-Inhalten ohne die Erlaubnis oder Genehmigung der Times untergraben und schädigen die Tools der Beklagten die Beziehung der Times zu ihren Lesern und bringen die Times um Abonnement-, Lizenz-, Werbe- und Partnereinnahmen“
„Trotz der anfänglichen altruistischen Versprechungen wurde OpenAI schnell zu einem milliardenschweren, gewinnorientierten Unternehmen, das zum großen Teil auf der unlizenzierten Verwertung urheberrechtlich geschützter Werke der Times und anderer beruht. Nur drei Jahre nach ihrer Gründung legte OpenAI ihren ausschließlich gemeinnützigen Status ab. Im März 2019 wurde OpenAI LP gegründet, ein gewinnorientiertes Unternehmen, das den Löwenanteil des Geschäftsbetriebs von OpenAI - einschließlich der Produktentwicklung - übernimmt und Kapital von renditesuchenden Investoren beschafft. Die Unternehmensstruktur von OpenAI entwickelte sich zu einem komplizierten Geflecht aus gewinnorientierten Holding-, Betriebs- und Mantelgesellschaften, die das Tagesgeschäft von OpenAI verwalten und den Investoren von OpenAI (allen voran Microsoft) Befugnisse und Einfluss auf den Betrieb von OpenAI gewähren, während sie gleichzeitig Kapital in Milliardenhöhe von Investoren beschaffen. Das Ergebnis ist: OpenAI ist heute ein kommerzielles Unternehmen mit einem Wert von bis zu 90 Milliarden Dollar und einem prognostizierten Umsatz von über 1 Milliarde Dollar im Jahr 2024. (…) Mit dem Übergang zum gewinnorientierten Status kam eine weitere Änderung: OpenAI beendete auch sein Engagement für Offenheit. OpenAI veröffentlichte die ersten beiden Iterationen seines Vorzeigemodells GenAI, GPT-1 und GPT-2, 2018 bzw. 2019 auf OpenSource-Basis. Im Jahr 2020 änderte OpenAI jedoch den Kurs und begann mit der Veröffentlichung von GPT-3, kurz nachdem OpenAI LP und andere gewinnorientierte OpenAIUnternehmen gegründet wurden und die Kontrolle über Produktdesign und -entwicklung übernahmen. GPT-3.5 und GPT-4 sind beide um Größenordnungen leistungsfähiger als die beiden vorangegangenen Generationen, doch die Beklagten haben ihre Entwicklung und das Training völlig geheim gehalten. Bei früheren Generationen verfügte OpenAI über umfangreiche Berichte, in denen der Inhalt des Trainingssets, das Design und die Hardware der LLMs detailliert beschrieben wurden. Nicht so bei GPT-3.5 oder GPT-4. Für GPT-4 zum Beispiel hieß es im "technischen Bericht", den OpenAI veröffentlichte: "Dieser Bericht enthält keine weiteren Details über die Architektur (einschließlich der Modellgröße), die Hardware, die Trainingsberechnung, den Aufbau des Datensatzes, die Trainingsmethode oder Ähnliches". Der leitende Wissenschaftler von OpenAI, Sutskever, rechtfertigt diese Geheimhaltung mit kommerziellen Gründen: "Der Wettbewerb da draußen ist groß .... Und es gibt viele Unternehmen, die das Gleiche tun wollen, so dass man dies unter Wettbewerbsgesichtspunkten als Reifung des Feldes sehen kann". Der Effekt war jedoch, die Identität der Daten, die OpenAI kopierte, um seine neuesten Modelle zu trainieren, vor Rechteinhabern wie der Times zu verbergen.“
„Synthetische Suchanwendungen, die auf den GPT-LLMs aufbauen, einschließlich Bing Chat und Browse with Bing for ChatGPT, zeigen umfangreiche Auszüge oder Umschreibungen des Inhalts von Suchergebnissen an, einschließlich Times-Inhalten, die möglicherweise nicht in der Trainingsmenge des Modells enthalten waren. Die von diesen Produkten angewandte "Grounding"-Technik umfasst den Empfang einer Eingabeaufforderung von einem Benutzer, das Kopieren von Times-Inhalten aus dem Internet, die sich auf die Eingabeaufforderung beziehen, die Bereitstellung der Eingabeaufforderung zusammen mit den kopierten Times-Inhalten als zusätzlicher Kontext für das LLM und das Zusammenfügen von Paraphrasen oder Zitaten aus den kopierten Times-Inhalten durch das LLM, um natürlichsprachliche Ersatztexte zu erstellen, die demselben Informationszweck dienen wie das Original. In einigen Fällen spucken die Modelle der Beklagten einfach mehrere Absätze der Artikel der Times aus. Der Inhalt solcher synthetischen Antworten geht oft weit über die Ausschnitte hinaus, die bei gewöhnlichen Suchergebnissen angezeigt werden. Selbst wenn die synthetischen Suchergebnisse Links zu den Quellen enthalten, müssen die Nutzer weniger zu diesen Quellen navigieren, da ihr aussagekräftiger Inhalt bereits in dem erzählenden Ergebnis zitiert oder paraphrasiert wird. Tatsächlich kann ein solcher Hinweis auf die Quellenangabe dazu führen, dass die Nutzer eher der Zusammenfassung allein vertrauen und sich nicht weiter durchklicken, um sie zu überprüfen. Auf diese Weise lenken synthetische Suchergebnisse wichtigen Verkehr von Urheberrechtsinhabern wie der Times ab. Ein Nutzer, der bereits die neuesten Nachrichten gelesen oder das richtige Produkt gefunden hat, hat weniger Grund, die ursprüngliche Quelle zu besuchen, selbst wenn - oder gerade wenn - die New York Times genannt wird.“
ANTRAG I:
Verletzung des Urheberrechts (17 U.S.C. § 501)
gegen alle BeklagtenANTRAG II:
Gehilfenhafte Urheberrechtsverletzung
gegen Microsoft, OpenAI Inc., OpenAI GP, OpenAI LP, OAI Corporation LLC, OpenAI Holdings LLC und OpenAI Global LLCANTRAG III:
Mitwirkende Urheberrechtsverletzung
gegen MicrosoftANTRAG IV:
Mitwirkende Urheberrechtsverletzungen
gegen alle BeklagtenANTRAG V:
Entfernung von Copyright Management Information (17 U.S.C. § 1202) gem. Digital Millennium Copyright Act
gegen alle BeklagtenANTRAG VI:
Gewohnheitsrechtlicher unlauterer Wettbewerb durch widerrechtliche Aneignung
gegen alle BeklagtenANTRAG VII:
Markenverwässerung (15 U.S.C. §1125(c))
gegen alle Beklagten
Als Ergebnis dieser Anträge bittet die New York Times das Gericht um folgende Urteile gegen die Beklagten:
„Gewährung von gesetzlichem Schadenersatz, Entschädigungszahlungen, Rückerstattung, Beschlagnahmung und anderen Rechtsmitteln, die nach dem Gesetz oder dem Billigkeitsrecht zulässig sind, an The Times. Den Beklagten dauerhaft zu untersagen, das hier behauptete rechtswidrige, unlautere und rechtsverletzende Verhalten zu begehen. Anordnung der Zerstörung gemäß 17 U.S.C. § 503(b) aller GPT- oder anderer LLM-Modelle und Trainingssätze, die Times Inhalte enthalten. Zuerkennung von Kosten, Auslagen und Anwaltshonoraren im gesetzlich zulässigen Umfang. Und alle anderen oder weiteren Maßnahmen, die das Gericht für angemessen, gerecht und billig hält.“
Antrag auf ein Schwurgerichtsverfahren
„Die Times fordert hiermit ein Schwurgerichtsverfahren für alle Ansprüche, die auf diese Weise verhandelt werden können.“
Was sagen die Beklagten?
Microsoft hat sich bislang nicht dediziert zu der Klage eingelassen. OpenAI betont: „Wir respektieren die Rechte der Ersteller und Eigentümer von Inhalten und setzen uns dafür ein, mit ihnen zusammenzuarbeiten, um sicherzustellen, dass sie von der KI-Technologie und neuen Einnahmemodellen profitieren. Wir hoffen, dass wir eine für beide Seiten vorteilhafte Art und Weise der Zusammenarbeit finden, wie wir es mit vielen anderen Verlagen tun.“
#newyorktimes #klage #urheberrechtsstreit #openai #microsoft #bezirksgericht #chatgpt #urheberrechtsverletzungen #sprachmodelle #trainingsdaten #strafzahlung #lobbyisten #politiker #ki-entwickler #generativekuenstlicheintelligenz #kommerziellesprodukt #medienhaus #profitablegeschaeftsmodelle #medienumbruch #vermoegensschaden #klageschrift #ethischestandards #regulierungsansaetze #problembewusstsein