"Sinds kort staat onze webserver vol met opvragingen van onze rss-feed door een spider die zich ilse-patgen/1.0 noemt. Blijkbaar is er iets mis met die spider-software of -configuratie want hij vraagt eindelooos hetzelfde bestand op, regelmatig wel vier keer per seconde. 't Is nog net geen DoS-aanval", zo klaagt iemand in de nieuwsgroep nl.internet.misbruik.

Ilse erkent de hoge frequentie van de rss-spider. "Onze rss-spider is inderdaad erg gretig met het ophalen van webpublicaties. Dit hebben wij bewust zo geconfigureerd, zodat we elk moment de meest actuele informatie in onze index hebben staan", licht Bas Blommerde van Ilse Media toe.

Ilse lanceerde onlangs een eigen rss-zoekmachine, blogsearch.ilse.nl. Dit is onder meer bedoeld om de weblogs van de dienst web-log.nl, dat eigendom is van Ilse, beter toegankelijk te maken.

Webloggers kunnen via de zogeheten ttl-code (time to live) aangeven hoe vaak een rss-spider langs moet komen. Dit is bijvoorbeeld afhankelijk van hoe vaak de site vernieuwd wordt. De 'overactieve' rss-spider van Ilse negeert deze aanwijzigingen echter. Dit tot ergernis van webloggers die klagen over de onnodige hoeveelheid dataverkeer die dit met zich meebrengt.

"Het probleem is dat de grote weblogdomeinen, zoals web-log.nl, vaak een vaste ttl ingesteld hebben voor alle rss-feeds. De daadwerkelijke updatefrequentie van de weblogs onderling wijkt echter sterk af. Daarom halen we nu alle rss-feeds, inclusief onderliggende postings, met grote regelmaat op", aldus Blommerde.

"We werken aan een systeem dat urls ophaalt op basis van 'frequency of

change', kortom hoe vaker een url wijzigt, hoe vaker hij opgehaald wordt." Dit is echter nog niet klaar. Om voorlopig gehoor te geven aan de klachten, gaat Ilse de updatefrequentie van de rss-spider aanpassen.