Fysicus Tim Berners-Lee werkte in 1989 in het prestigieuze centrum voor deeltjesfysica CERN, waar hij een softwareproject voorstelde waarmee wetenschappers hun kennis konden delen door middel van zogenoemde 'hypertext'-documenten. Hij maakte de eerste webserver en webbrowser, en in de zomer van 1991 werd het web goed genoeg gevonden om ook buiten het CERN te gebruiken, als 'world wide web'. Berners-Lee bleef verder werken aan een verbetering van het web en in 1994 richtte hij het World Wide Web Consortium (W3C) op. Deze organisatie moest een forum bieden voor de ontwikkeling van het web. In de afgelopen tien jaar is het world wide web snel geëvolueerd en is het W3C er nog even actief mee bezig.

De standaarden html (hypertext markup language) en css (cascading style sheets), waarmee elke moderne website wordt gebouwd, waren de eerste technologieën die het W3C promootte. Toen kwam xml (extensible markup language), een algemeen formaat om gestructureerde bestanden op te slaan. Html werd op basis van xml geherformuleerd tot xhtml. In het kielzog van xml kwamen er toen een hoop standaarden: xsl (estensbile stylesheet language), svg (scalable vector graphics) et cetera. Xml vormt momenteel de basis van een groot deel van de W3C-standaarden.

Spraak

In 2004 hield het W3C zich sterk bezig met de toegang tot het web door middel van spraak. Zogenaamde 'voice browsers' maken het mogelijk via de telefoon met gesproken commando's webgebaseerde diensten aan te sturen. De gevraagde informatie kan ook door middel van spraaksynthese beantwoord worden. Voorbeelden van diensten waar dit van nut kan zijn: reisagentschappen, het bestellen van tickets voor optredens, thuisbankieren of call centers.

De interactie tussen de webdienst en de gebruiker wordt in een voicexml-bestand gespecificeerd, net zoals dit voor het gewone web in een html-bestand staat. Dit bestand geeft aan welke woorden en zinnen herkend worden als commando's en hoe het programma erop moet reageren. De gebruiker kan bijvoorbeeld op een bepaald moment tijdens de interactie de keuze hebben uit drie opties. Als hij dan een ander woord zegt, zal het programma zeggen dat hij het commando niet herkent. Als hij één van de bekende opties kiest, wordt er gepast op gereageerd. Voicexml maakt het mogelijk zulke interacties op een gestandaardiseerde manier te specificeren.

Semantisch web

Een tweede stokpaardje van het W3C is het semantische web. De evolutie naar het semantische web zet zich al vanaf het begin van de ontwikkeling van het web door. In de eerste versies van html was wat er op een pagina van informatie staat en de manier waarop die informatie wordt weergegeven nog erg verstrengeld. Steeds meer en meer werd er gewerkt aan een scheiding van vorm en inhoud. Zo wordt de inhoud van een webpagina nu in xhtml uitgedrukt en de vorm in css.

Deze evolutie gaat nog veel verder. Berners-Lee maakt er al vanaf het begin geen geheim van dat hij droomt van een 'semantisch web' dat niet enkel bestaat uit voor mensen leesbare webpagina's, maar ook uit documenten die door computers kunnen worden 'begrepen' en met elkaar in verband gebracht worden. Computers kunnen de informatie op een website niet begrijpen, aangezien er tekst staat in natuurlijke taal, bedoeld voor mensen. In het semantische web krijgt informatie daarentegen een duidelijk gedefinieerde betekenis voor computers.

Het semantische web is gebaseerd op de standaarden rdf (resource description framework) en owl (web ontology language). Hiermee kunnen expliciete verbanden tussen allerlei soorten informatie aangegeven worden. Het huidige web is nog altijd gefocust op het zichtbare: webpagina's met tekst. Een groot deel van het semantische web zal daarentegen onzichtbaar zijn voor mensen.

Het bestaat uit pure gegevens en verbanden ertussen, direct bruikbaar door computerprogramma's. Het open formaat rdf zorgt ervoor dat allerlei verschillende soorten programma's toegang kunnen hebben tot deze informatie en ze op manieren kunnen combineren die de auteurs ervan waarschijnlijk niet voorspelden. Met owl kunnen relaties tussen klassen van informatie opgegeven worden, bijvoorbeeld dat een man een persoon van het mannelijke geslacht is. In combinatie met gegevens in rdf kan een computer zo 'redeneren'.

Toekomst

Welke richting zal het web in de komende jaren uitgaan? De kans is groot dat een groot deel van het antwoord al op de website van het W3C te vinden is. Hun 'recommendations' zijn geen officiële standaarden maar hebben wel een grote invloed op de software-industrie. En hoe gaat het ondertussen met Tim Berners-Lee? In 2004 werd de Brit geridderd en vorige week kreeg hij de Great Britons-prijs in de categorie wetenschap.

www.w3.org