Hoe een Nederlandse hacker het web groot maakte

Dirk-Willem van Gulik

Artikelgereedschap

  • Tip ons
  • Printen
  • Reacties (8)
9x Aanbevolen

Gepubliceerd: Zaterdag 11 juni 2011
Auteur: Loek Essers

Dirk-Willem van Gulik stond aan de wieg van de Apache Webserver, was CTO bij videodienst Joost en is nu Chief Technical Architect bij de BBC. Een Nederlandse hacker pur sang, met grootse plannen.

En dan moet het woord "hacker" hier gelezen worden in de de wat meer traditionele zin van het woord. Eind jaren '80 begin jaren '90 was Van Gulik een onderzoeker bij het Europese Joint Research Center (JRC), het equivalent van het Nederlandse TNO maar dan voor heel Europa. "Een van de dingen die ik daar moest doen was het combineren van satellietbeelden met metingen uit de Baltische zee", vertelt Van Gulik die destijds bezig was met global warming. Om dat voor elkaar te krijgen moest er veel data worden vergeleken, wat moeilijk was omdat de satellietdata lastig te verkrijgen was. Er waren veel bugs en timingproblemen.

CERN

Van Gulik ging op zoek naar een manier om zijn probleem op te lossen. "Een van de dingen die ik als student natuurkunde had gezien in CERN was een wonderbaarlijk ding dat je over je data heen kon leggen: een webserver, of zoals het toen heette, een dataserver. "En dat loste mijn probleem eigenlijk erg goed op." Daar kwam nog bij dat het rond die tijd mogelijk werd om satellietdata binnen te halen via het netwerk, een soort voorloper van het huidige internet.

Voorheen moest elektronische satellietdata besteld worden bij NASA of de ESA. Daar kon een formulier worden gedownnload dat werd geprint, ingevuld en vervolgens opgestuurd of gefaxt naar de organisatie. "En toen moest je een half jaar wachten totdat er een grote container of vrachtwagen met tapes voorreed", zegt Van Gulik. Vervolgens moest al die data verwerkt worden door studenten, wat ook nog een half jaar tot jaar duurde en daarna was de data pas geschikt voor het onderzoek.

Snel data ontsluiten

Niet heel erg efficiënt vond Van Gulik. "Het mooie aan de CERN dataserver was dat je daar een paar coördinaten invoerde waardoor op de achtergrond een grote taperobot aan het werk ging, waarna binnen een aantal dagen via een soort e-mail werd gemeld: je FTP-dataset staat klaar." Een ideale manier voor Van Gulik om de door hem benodigde data snel te ontsluiten. "Dat was uiteraard een hele verbetering omdat deze manier van werken vrij snel belangrijk werd in het gebied van planetaire wetenschappen."

Toch werkte deze vroege versie van de webserver nog niet perfect, de techniek moest verbeterd worden. Belangrijke ontwikkeling was dat op hetzelfde moment de image tag in Amerika werd geïntroduceerd, waardoor mensen afbeeldingen konden delen via de dataservers zoals foto's van katten of hun familie. Dat was nog erg omslachtig omdat alle foto's wel nog moesten worden ingescand. Maar toch was het volgens Van Gulik een belangrijke volgende stap in de ontwikkeling van het internet. "Opeens kon je de servers niet alleen gebruiken voor wetenschappelijke data maar ook voor leuke dingen."

Begin van het web

Vanaf dat punt gingen steeds meer mensen gebruik maken van de NCSA browser, de voorloper van Netscape. Er ontstond een vriendschappelijke race tussen alle aangesloten onderzoeksinstituten, wetenschappers en bedrijven om collectief te bouwen aan wat wij nu het wereldwijde web zouden noemen. "Iedereen probeerde zoveel mogelijk te innoveren maar iedereen moest tegelijkertijd ook samenwerken, want als je dat niet deed kon jouw server geen contact maken met iemands browser en zou niets werken", legt Van Gulik uit. Er moest dus technisch volledig worden samengewerkt, terwijl er hevig werd geconcurreerd op commercieel gebied.

Het hele web was op dat moment opgebouwd rondom NCSA, maar de oprichters daarvan verlieten het bedrijf om te gaan werken aan Netscape, iets waar veel mensen niet op zaten te wachten. "Daardoor zaten velen van ons compleet in de rats. Want opeens werd de software waar wij onze carriëres en onze bedrijven op hadden gebouwd in de steek gelaten door NCSA." En daaruit groeide langzaam de Apache Software Foundation, een non-profitbedrijf dat een van de grondleggers is van open source software.

Beveiliging op het web

De geschiedenis van de Apache Software Foundation is innig verbonden met de ontwikkeling van de Apache HTTP Server. Vanaf 1994 werd er aan die webserver gebouwd die voortborduurde op de NCSA HTTPd webserver en de server die Tim Berners Lee, de 'vader van het internet, ontwikkelde voor CERN. Van Gulik was een van de ontwikkelaars die de Apache Server bouwde, waar op moment van schrijven 63 procent van alle websites ter wereld op draait, 66 procent van de miljoen drukstbezochte websites gebruikt het platform.

Van Gulik was vanaf het begin betrokken bij de ontwikkeling van de webserver. Eerst vanuit Italië, waar hij werkzaam was bij JRC en later vanuit San Francisco. "Dat waren de echte begindagen, de piek van de open source beweging en de Apache software foundation." Van Gulik maakte onder andere een loginsysteem, zodat wetenschappelijke data achter slot en grendel toch beschikbaar kon blijven. Op dat moment een uniek systeem omdat alles op het internet in principe toegankelijk was, legt Van Gulik uit. De afscherming was nodig omdat op de satellietbeelden veel gevoelige informatie te zien was, zoals bijvoorbeeld legerbasissen. Ook werkte hij aan de SSL-beveiliging die nu onder andere wordt gebruikt door credit card maatschappijen.

Open source

Daarnaast hield Van Gulik zich vooral bezig met het concept open source en de open source licenties. Hij legt uit dat het handig was dat hij een Europeaan was in de Apache Software Foundation. Hij merkte dat het idee achter open source van nature niet direct op handen werd gedragen.

"Ik heb veel tijd besteed aan het meewerken aan een framework dat medogenloos concurrerende bedrijven zoals Oracle, HP, Sun en IBM in staat stelde samen te werken aan een stuk software, zonder elkaar een mes in de rug te steken. Terwijl ze ondertussen op de concurrerende markt daarbuiten wel naar hartelust messen in elkaars rug konden steken of wat het ook is dat kapitalistische Amerikaanse bedrijven doen."

BBC

Van Gulik is meer dan 8 jaar president en lid van de raad van bestuur van Apache geweest. Hij werkte daar onder andere aan technieken als XML en Tomcat. Daarna was hij onder andere nog ongeveer 2,5 jaar werkzaam als CTO voor webvideostartup Joost, die vrij snel weer ter ziele ging, en hij deed een aantal andere projecten. Sinds 2008 werkt hij voor de Britse omroep BBC, waar hij nog steeds Chief Technical Architect is.

"Die stap stelde me in staat om in principe terug te gaan naar webservers. Ik ben bij Joost wat te lang bezig geweest met video", aldus Van Gulik. "De BBC is eigenlijk echt een verbazingwekkende plek als het aankomt op webservers." Dat komt ondat de BBC de enige grote website in de top 50 van grootste sites die niet wordt gerund door Amerikaans internetbedrijf en geen geld binnenhaalt met advertenties.

Slimme oplossingen voor weinig geld

Het unieke aan de BBC is dat ze verplicht zijn om uit te zenden via het internet, net zoals ze dat moeten doen via de ether. Om de kosten te drukken moet de infrastructuur zo zijn ingericht dat er geen tienduizenden servers nodig zijn om de vraag het hoofd te bieden. Van Gulik wijst erop dat het geld van de BBC binnenkomt via de Britse versie van het kijk- en luistergeld. "Als ons aantal bezoekers vertienvoudigt worden onze inkomsten niet groter, dat bedrag blijft gelijk, dus moeten we een oplossing vinden die tien keer goedkoper is. Daar komt bij dat als je een server van 1 gigabit gebruikt en die wil vervangen voor een server van 10 gigabit, dan is die server niet 10 keer duurder maar eerder 100 keer duurder", legt Van Gulik uit. "Dat maakt het een tot geweldige engineering uitdaging."

De BBC kan niet hetzelfde doen als de Google's en Yahoo's van deze wereld. "Als zij tien keer zoveel gebruikers krijgen, verdienen ze ook tien keer zoveel geld." En dan is er ook geld om extra servers aan te schaffen. Daarom wordt bij de BBC gewerkt aan de ontwikkeling van eigen producten en software, om zo efficiënt mogelijk te werken en de boel betrouwbaar en altijd beschikbaar te houden. "Dat is waar ik de afgelopen jaren mee bezig ben geweest en me eigenlijk nog steeds mee bezig houd."

De serie it-helden gaat over de 'gewone' it-er in zijn dagelijke werk. Hij neemt elke uitdaging aan, overwint tegenslag, vindt oplossingen voor bijzondere problemen en leert van zijn daverende uitglijders.

Nieuwsbrief

Ontvang dagelijks een overzicht van het laatste ICT-Nieuws in uw mailbox

Whitepapers

  • Maximaliseer het voordeel van SaaS

    Cloud-applicaties hebben grote invloed op het gebruik van de IT-architectuur en niet ieder project levert de verwachte voordelen op.

    Downloaden
  • Houdt grip op UC-uitdagingenUnified communications biedt heel veel, maar heeft ook specifieke uitdagingen!
  • Flexibele IT noodzaak voor bankenOnderzoeksrapport over de beperkte flexibiliteit van veel IT-systemen in de bancaire wereld. Lees meer!
» Meer whitepapers

Peiling

Loading Poll

Video: Review: HTC One X-smartphone met vijf...

Review: HTC One X-smartphone met vijf cores (video)