Het onderbrengen van alle ministeries in één grote overheidssite is erg veel werk. Alles moet naar hetzelfde systeem en daarvoor moet alle content herschreven worden en opnieuw worden geïndexeerd. Maar dat doen ze bij de overheid zelf.

“Ze gebruiken Hippo en alles wat in Hippo zit”, zegt Cahn. “En Apache is de drijvende kracht achter onze software. De reactie van de open source gemeenschap is dan ook dat het geweldig is dat de overheid Apache gaat gebruiken.”

Anders dan andere

Hippo mag dan gebruik maken van veel componenten van Apache, maar de twee staan niet aan elkaar gelijk. Cahn: “In Apache zitten typisch heel generieke componenten. Maar een CMS is een heel specifiek ding. Het is heel lastig om dat generiek te maken. Er zijn dan ook heel veel CMS’en. En Hippo is anders dan die andere, omdat wij ons richten op grote hoeveelheden content.”

Hippo wordt ingezet bij bijvoorbeeld VNU Uitgevers in Engeland. Voor bladen is het systeem erg geschikt, volgens Cahn. Zo kunnen documenten vanuit Quark en Indesign direct naar de website worden geplaatst, precies zoals ze in het blad hebben gestaan. Daar moet het systeem wel op ingesteld zijn. Het moet bijvoorbeeld gokken wat het intro is van een artikel, wat de tussenkoppen en wat de tekst. Aan de webredacteur wordt dan om bevestiging gevraagd en daarna kan het werk direct worden gepubliceerd.

Automatisch gegenereerd

“Hippo is heel erg gericht op het gebruik van metadata”, zegt Cahn. “Er is bijvoorbeeld hulp bij het kiezen van keywords. Die worden automatisch gegenereerd op grond van de tekst en daarna als suggestie aangeboden. Daarbij wordt rekening gehouden met synoniemen. Als tag staat er bijvoorbeeld ‘ambulance’, maar ziekenwagen moet daar ook onder vallen. Daarin moet het systeem steeds kunnen blijven leren.”

Omdat Hippo goed is in dit soort taken is het volgens Cahn heel goed inzetbaar bij bladen en bij de overheid. “Dat soort dingen kunnen we heel goed doen, juist omdat we ons niet druk maken over webpagina’s, maar om de content.”

Dat is belangrijk omdat er steeds meer content komt. “Tegenwoordig gooien we niets meer weg”, zegt Cahn. “Alles blijft online. Dat betekent dat informatie veel langer meegaat dan vroeger. En het mooie aan het web is dat dat ook waardevol is geworden. Maar het betekent wel dat de informatie die we hebben ook naar de toekomst toe vindbaar moet worden gehouden.” En juist door die grote hoeveelheden informatie wordt het zoeken veel moeilijker. “Als je zoekt krijg je vaak nul hits, of juist tien miljoen. Dan moet je dus ook kunnen zoeken op naam van de auteur, of op artikelen van de laatste week.”

Portal

Om hergebruik van data mogelijk te maken moeten alle relaties tussen de content duidelijk worden. “En dat maken we mogelijk bij Hippo”, zegt Cahn. Naast het CMS hebben ze ook nog een portal omgeving, waarin ze dezelfde technieken gebruiken. “Dat is een webpagina met verschillende applicaties naast elkaar op het scherm. Als je acht systemen hebt, dan wil je die veilig met elkaar integreren en je wilt niet dat je acht keer apart moet inloggen.”

De portal maakt de koppeling met de achterliggende applicaties en laat ze zien als blokjes, maar integreert ze ook met elkaar. “Zoek je naar een telefoonnummer van iemand, dan krijg je ook de e-mails die hij heeft verstuurd en de documenten die hij heeft aangemaakt. Dat wordt allemaal met metadata aan elkaar gekoppeld.”

Bron: Techworld