De Koninklijke Bibliotheek sloot vorig jaar een overeenkomst met Google voor het digitaliseren van 160.000 rechtenvrije boeken. De samenwerking wordt gezien als het grootste digitaliseringsproject van Nederland en brengt de digitalisering van cultureel erfgoed voor de KB in een stroomversnelling. Deskundigen twijfelen over het project en de voorwaarden die Google stelt.

Praktisch onuitvoerbaar

De voorwaarden die Google stelt voor het digitaliseren zijn erg strikt, concludeert IT-recht advocaat Mark Jansen tegenover Webwereld. “De KB moet bijvoorbeeld voorkomen dat derden de digitale boeken commercieel gebruiken. Dat is praktisch onuitvoerbaar." Mireille Kok (Hoofd communicatie KB) vindt dat onzin: “Het contract vinden wij erg goed. Het biedt ons de kans om duizenden boeken in korte tijd te digitaliseren. Een win-winsituatie."

Google investeert miljoenen om de klassieke boeken te digitaliseren en claimt hierbij de volledige commerciële rechten van de digitale versies. De KB wordt verplicht technische maatregelen te nemen tegen het systematisch downloaden van boeken en het indexeren van pagina´s.

De KB krijgt een kopie voor eigen websites, is verplicht om een beveiligingssysteem in te stellen dat gebruikers belet om digitale boeken te verspreiden of te gebruiken voor commerciële doeleinden, zo staat vermeld in het contract. Een lastige opgave, volgens Jansen. “Ik zet daar vraagtekens bij. Het lijkt me praktisch onuitvoerbaar om dat te controleren en ik vraag me af of de KB deze plichten wel kan waarmaken."

Hyperlink naar Google Books

Waar de KB eerder nog aangaf digitale boeken op de eigen website te gaan publiceren, blijkt dat uit een reactie van de KB niet zeker. Per e-mail schrijft Kok dat de bibliotheek gebruikers via de KB-catalogus met een hyperlink zal verwijzen naar de gedigitaliseerde boeken in Google Books. Dit betekent dat de bibliotheek zelf geen kopie zal aanbieden aan gebruikers, maar gemakshalve doorverwijst naar Google. Desgevraagd reageert Kok dat de KB nog beraadslaagt over een apart KB-platform, maar het is onduidelijk wat zij hier precies mee bedoelt.

Hoewel de KB de voorwaarden van Google allesbehalve streng vindt, duidt de onzekerheid over publiceren op de KB-site en het hyperlinken naar Google Books erop dat de bibliotheek zich niet wil branden aan het 'voorkomen van verspreiding en commercieel misbruik' via hun site. Wanneer de KB zijn verplichtingen niet nakomt is het de vraag wat er gebeurt. Volgens Jansen moet bij schending van het contract naar Amerikaans recht beoordeeld worden wat de gevolgen zijn.

Google´s escape

Google wordt in het contract verplicht gesteld om de gebruikers 'toegang zonder kosten' te verlenen tot de volledige publieke domeinboeken. Mocht de zoekgigant daar gedurende een periode van 6 maanden of twee periodes van 90 achtereenvolgende dagen niet in slagen, dan vervallen alle beperkingen uit het contract voor de digitale boeken die niet toegankelijk zijn.

Mocht een publiek domeinboek offline zijn, dan moet de KB dit schriftelijk melden aan Google, dat vervolgens 30 dagen de tijd krijgt om het euvel te herstellen, vermeldt het contract. Maar Advocaat Jansen vertelt tegen Webwereld dat Google nog een andere escape heeft ingebouwd. “Deze verplichting geldt niet wanneer Google een boek offline heeft gehaald omwille van de kwaliteit en technische of wettelijke redenen. Dat is wel erg breed geformuleerd. Betreft dit de kwaliteit van het boek of de kwaliteit van de dienst? Kortom, er is wel erg veel onder te scharen."

Wetenschappelijk onbruikbaar

Los van de twijfels die het contract oproept, wordt ook de kwaliteit van de digitale boeken betwist. Volgens Wijnand Mijnhardt, Hoogleraar geschiedenis, is Google Books totaal onbruikbaar voor de wetenschap. “Ik sta er ambivalent tegenover. Aan de ene kant is het prachtig dat Google digitaal boeken toont die normaal praktisch niet waren in te zien wegens afstand. Aan de andere kant zijn de digitale boeken totaal onbruikbaar voor wetenschappers. De OCR (optical character recognition) is dermate slecht dat text mining veel moeite kost. Ook het zoeken naar specifieke boeken uit een nauwkeurige tijdsperiode gaat heel slecht", aldus Mijnhardt.

Bibliothecaris Bert Zeeman van de UvA komt tot dezelfde conclusie: “Sommige pagina's zijn slecht zichtbaar vanwege hand- of vingerafdrukken van medewerkers en de OCR is niet erg goed." Niet voor niets wordt volgens Zeemand de scantechniek van Google ook wel 'Quick & Dirty' genoemd.

KB-woordvoerster Kok daarentegen, verzekert dat de boeken goed te lezen zijn en dat ze altijd opnieuw gescand kunnen worden door een andere partij. Het contract is immers niet exclusief, wat inhoudt dat een ieder boeken mag inscannen. Mijnhardt wijst erop dat door de massa die Google scant (160.000 boeken) de noodzaak om een fatsoenlijke OCR-versie te maken voor de KB kleiner wordt. “En dat is zonde voor de wetenschap." Kok geeft aan dat de wetenschap en academici de belangrijkste doelgroep vormen, maar dat de bibliotheek geen problemen heeft met de kwaliteit van de scans.

Voordelen

Toch biedt de samenwerking ook voordelen. Bibliothecaris Zeeman spreekt van een grote stap voorwaarts in de digitalisering. “Als de KB moet wachten op financiering vanuit de overheid had het nog tientallen jaren kunnen duren." Hij wijst erop dat het de Nederlandse overheid duidelijk ontbreekt aan een structurele visie op de digitalisering van cultureel erfgoed."

Mijnhardt op zijn beurt is blij met de poging van Google om oude werken digitaal te ontsluiten, maar nuanceert dat de boeken voornamelijk een basisbehoefte vervullen. De lengte van het contract (15 jaar), de opgelegde beperkingen en de kwaliteit kunnen volgens hem op langere termijn schadelijk zijn.

Google is in ieder geval tevreden met de samenwerking. Google-woordvoerder Mark Jansen (niet te verwarren met advocaat Mark Jansen) mailt aan Webwereld: “Veel van de kennis van de wereld is verzameld in boeken en in veel gevallen niet online beschikbaar. Onze gebruikers profiteren hiervan als zij bij ons zoeken, want boeken zijn een rijke bron van kennis en informatie. Natuurlijk is Google Books ook goed voor Google - want hoe meer informatie gedigitaliseerd is en online beschikbaar, hoe meer gebruikers onze diensten gebruiken."

Contract

De Koninklijke Bibliotheek hield het contract met Google geheim, ondanks eerdere uitspraken om het contract openbaar te maken. Webwereld kreeg het contract deze week in handen na het indienen van een Wob-aanvraag. De bibliotheek publiceerde het contract vervolgens ook online. Hieronder is het contract in te zien. De belangrijkste beperkingen voor de Koninklijke Bibliotheek staan vermeld in artikelen 4.7 en 4.8.

Het tot voor kort geheime contract tussen Google en de Koninklijke Bibliotheek: Google KB Binder1