Miljoenen boeken gekocht, geknipt en aan AI doorgegeven om Claude te trainen en het auteursrecht te omzeilen: de Antropische zaak breekt uit

Voordat een boek een dossier wordt, is het nog steeds een object. Het heeft een rug, pagina’s, lijm, gewicht, stof. In het geval van Anthropic, het bedrijf dat Claude ontwikkelt, kwam dit zeer concrete onderdeel terecht in een industrieel proces: boeken gekocht op de tweedehandsmarkt, geknipt, gescand en omgezet in digitale tekst. Wat er van de volumes overbleef, werd vervolgens ter recycling aangeboden.

De interne naam van het project was Project Panama. Uit de documenten die naar voren kwamen in de auteursrechtzaak begrijpen we de betekenis van de operatie: het verzamelen van een grote hoeveelheid fysieke boeken om modellen voor kunstmatige intelligentie te trainen. Boeken waren nuttig omdat ze als een beter taalkundig onderwerp werden beschouwd dan het lawaai van het internet. Minder zinnen willekeurig online verzameld, meer teksten geschreven, geredigeerd en gepubliceerd.

Van boeken tot data

Het sterkste deel ligt in de methode. De volumes kwamen van tweedehandshandelaren, werden voorbereid voor destructief scannen, langs de rug uitgesneden en door professionele hogesnelheidsscanners gehaald. Eenmaal gedigitaliseerd kwamen er geen boeken meer terug. Aan de ene kant bleven gegevens over en aan de andere kant papier dat gerecycled moest worden.

De precieze hoeveelheden zijn niet helemaal duidelijk, maar we hebben het over honderdduizenden, misschien wel miljoenen volumes, met een project dat is ontworpen om in ongeveer zes maanden tussen de 500.000 en 2 miljoen boeken te digitaliseren. Geen kleine archiefoperatie. Een supply chain, met leveranciers, magazijnen, snijmachines, scanners, kosten en logistiek.

En dit is waar de zaak zelfs buiten het juridische debat interessant wordt. Kunstmatige intelligentie wordt vaak omschreven als iets lichts, ver weg, bijna immaterieel: cloud, algoritme, schone interface. Hier maakt de wolk echter het geluid van papier. Het bevat dozen, industriële messen, losse pagina’s, gekochte en gedemonteerde boeken.

Het auteursrechtprobleem

In de Amerikaanse procedure onderscheidde rechter William Alsup twee niveaus. Het gebruik van boeken die legaal waren gekocht en vervolgens werden gescand om Claude te trainen, werd verenigbaar geacht met fair use, de Amerikaanse doctrine die in sommige gevallen het gebruik van beschermde werken zonder toestemming toestaat. Het verhaal over illegale boeken was anders: uit de documenten bleek dat Anthropic miljoenen teksten uit illegale archieven had gedownload en opgeslagen, en dat deel werd als een afzonderlijke overtreding behandeld.

De overstap naar gebruikte fysieke boeken lijkt dus ook een keuze van juridische voorzichtigheid. Het kopen van een papieren exemplaar gaf het bedrijf meer solide grond dan het downloaden uit piratenbibliotheken. In de Verenigde Staten kan iedereen die een fysiek object koopt, het doorverkopen, uitlenen of vernietigen. Het probleem ontstaat wanneer dat object wordt omgezet in een digitale kopie en wordt ingevoegd in systemen die nieuwe tekst kunnen genereren.

Anthropic stemde vervolgens in met een schikking van $ 1,5 miljard om de class action-rechtszaak van de auteurs te schikken, zonder aansprakelijkheid toe te geven. De schikking heeft betrekking op illegale werken en levert ongeveer $3.000 per betrokken boek op. Vanaf mei 2026 was de definitieve goedkeuring echter nog in behandeling: rechter Araceli Martinez-Olguin vroeg om meer details over juridische kosten en betalingen aan de hoofdeisers.

AI ontstaat niet uit het niets

De Antropische zaak betreft Claude, maar spreekt de hele sector aan. Grote generatieve modellen hebben teksten, afbeeldingen, code, artikelen, handleidingen, romans en essays nodig. Ze hebben menselijke arbeid nodig die al geproduceerd is. Soms wordt dat werk geautoriseerd en betaald. Andere keren wordt het massaal verzameld, in ondoorzichtige datasets gestopt en pas besproken als er een rechtszaak aankomt.

Project Panama maakt deze afhankelijkheid zichtbaar. Om een machine beter te laten schrijven, waren er boeken nodig die door mensen waren geschreven. Om een chatbot natuurlijker te maken, werd gebruik gemaakt van werken gemaakt door auteurs, redacteuren, vertalers, proeflezers, uitgeverijen, bibliotheken en lezers. De digitale belofte is nog steeds afhankelijk van zeer fysieke materie.

Het onderwerp betreft ook Europa, waar de relatie tussen auteursrecht, datamining en kunstmatige intelligentie open blijft. Bedrijven praten over innovatie, transformatie, vooruitgang. Degenen die inhoud maken, vragen om toestemming, compensatie en traceerbaarheid. In het midden zijn er rechtbanken, nog jonge regels en een heel concrete vraag: hoeveel is mensenwerk waard als het brandstof wordt voor AI?

Mogelijk bent u ook geïnteresseerd in: