Google: "!" in url maakt Ajax-sites indexeerbaar

http

Gepubliceerd: Vrijdag 9 oktober 2009

Google heeft een nieuwe standaard voorgesteld, waardoor websites die zijn gebouwd met Ajax-technologie beter zijn te vinden voor zoekmachines. De meningen erover zijn verdeeld.

Toon volledig artikel

Bolleke op Vrijdag 9 Oktober 2009 12:13

image zomerhack badge 3

Het klinkt wel sympathiek, maar ik vind het eigenlijk een onzinvoorstel. Je kunt toch ook gewoon die dingen onder een 'werkende' url zetten die je vervolgens via javascript eigenlijk met Ajax laat ophalen? Return false erachter en je hebt het beste van beide werelden.

Daarnaast vind ik de voorgestelde standaard sws weird, alles achter # "ziet" de server niet. Nu moet-ie dat dan wel gaan zien er vervolgens bedenken of er een ! op volgt of niet. Bovendien is #target gelinkt aan id="target", maar id="!target" is geen validerende HTML. Dat zou dan dus alsnog id="target" moeten blijven, waardoor ze weer niet overeenkomen. Eigenlijk ben ik hier dus zwaar op tegen :) Anderen?

elmo2you op Vrijdag 9 Oktober 2009 13:19

image

Ik ben het volledig met je eens.

Daaraan toegevoegd, vind ik het vreemd dat het artikel het doet voorkomen alsof er een relatie bestaat tussen AJAX en URLs. Of dit komt door Maarten Hell (geweldige achternaam voor een BOFH overigens) of omdat Google dit zelf zo gepresenteerd heeft weet ik niet. Wat ik wel weet is dat het volstrekte onzin is.

Door gebruik te maken van mod_rewrite (in Apache althans, ik vermoed dat alle andere Web Servers vandaag de dag een gelijksoortige functionaliteit bezitten), en vervolgens in het MVC frontend een inkomende URL te mappen naar een specifieke pagina/processor/whatever-you-want-to-call-it, kun je tegenwoordig willekeurige URLs gebruiken voor AJAX server requests.

Dat Google niet blij is met de gebruikte URLs in huidige web sites met AJAX implementaties, hebben ze enkel te danken aan de ontwerpkeuzes van de mensen die deze web sites gemaakt hebben. Ik zie overigens niet in waarom deze ontwerpkeuzes nu opeens door een Google standaard gedicteerd zouden moeten worden. Enerzijds omdat er goede redenen kunnen zijn om afwijkende/bijzondere URLs te gebruiken. Vervolgens de kans lopen dat Google gaat klagen omdat je je niet aan een standaard houdt lijkt me schadelijk en onwenselijk. Anderzijds denk ik dat het aan de eigenaar van een web site hoort te liggen of deze wel of niet goed indexeerbaar wil zijn in Google's zoekmachine, niet aan Google.

Ik weet niet welke kant Google op wil met dit voorstel, maar het heeft er bij mij alle schijn van dat ze proberen hier iets te standaardiseren in hun eigen voordeel.

Op zichzelf is er niets verkeerd met standaarden, maar dit voorstel zal hoe dan ook voornamelijk in het voordeel zijn van Google zelf zijn en dat vindt ik bedenkelijk. Zelf als alle andere partijen ook voordeel uit deze potentiële nieuwe standaard zullen halen vindt ik het nog steeds zorgelijk dat een bedrijf als Google gaat dicteren hoe een techniek als AJAX gebruikt dient te worden.

Natuurlijk kan je het altijd anders doen, maar als Google je vervolgens negeert in hun zoekmachine met de mededeling dat je je maar aan hun standaard te houden hebt, dan zie ik dit voorstel toch voornamelijk als een poging om de concurrentie op het gebied van Google's eigen AJAX toolkit een hak te zetten. Met andere woorden, de zoveelste poging van Google om haar marktdominatie te vergroten onder het mom dat iedereen er beter van wordt (maar voornamelijk Google).

Natuurlijk mogen ze voorstellen om een standaard op te stellen voor een bepaalde structuur in AJAX gerelateerde URLs. Ik vraag me echter wel af wat dit voorstel aan voordelen biedt ten opzichte van bijvoorbeeld de doorgaans in REST interfaces gebruikte URLs.

Webman op Zondag 11 Oktober 2009 22:54

image

Dit technische verhaal slaat echt nergens op. Tegenwoordig bepaal je als webredacteur in een goed CMS helemaal zelf je URL. De URL heeft helemaal niets meer met de techniek te maken. Hoe vriendelijker de URL voor gewone gebruikers hoe beter je scoort in de organische zoekresultaten. De URL vertelt bijvoorbeeld iets over het niveau waar de betreffende pagina zich bevindt in de website en bevat tevens het zoekwoord waar de betreffende pagina op geoptimaliseerd is. Een goede URL is bijvoorbeeld www.website.nl/producten/ajax.html
Websites met rich content zoals Flash en Ajax kunnen niet alleen door Google heel moeilijk geoptimaliseerd worden maar ook door alle andere zoekmachines en worden daarom door de betere webbouwers ook zoveel mogelijk vermeden. Google begint langzamerhand betere technieken te ontwikkelen voor de indexering van Flash en Ajax, en voor zover ik het kan beoordelen op basis van dit artikel dient het '!' alleen maar om Google te laten weten wat voor website het is om daar de juiste indexeertechniek op los te laten. Het heeft dus niks te maken met de dominantie van Google, ze proberen juist een oplossing te vinden voor het feit dat Flash, Ajax en andere RIA's geen enkele rekening houden met zoekmachines.

Persoonlijk begrijp ik ook niet waarom websites zo nodig helemaal in Flash of Ajax gemaakt moeten worden. Gebruiksonvriendelijk en je site is onvindbaar. Dat je bepaalde onderdelen zoals filmpjes etc. met RIA's doet is wel logisch, maar daar gaat dit artikel volgens mij niet over.

Nappy op Vrijdag 9 Oktober 2009 13:54

image

Je moet vanwege toegankelijkheids eisen toch ook een voledige sitemap hebben? Dan is alle content toch "normaal" te benaderen?

magikMaker op Vrijdag 9 Oktober 2009 14:09

image

Het lijkt me toch echt wel de taak van de crawler/zoekmachine om uit te zoeken hoe de website in elkaar zit en hoe deze geindexeert moet worden. zoals Nappy al zegt, meeste sites plaatsen al een sitemap.xml

Bolleke op Vrijdag 9 Oktober 2009 14:21

image zomerhack badge 3

Nou, het gaat niet om onbereikbare pagina's, maar om het updaten van een sectie van een pagina. Wat dan netjes is om te doen is de URL te veranderen naar /somepage#id-van-sectie, zodat het zo te bookmarken valt voor de gebruiker. Google stelt dus voor om in zo'n geval /somepage#!id-van-sectie te gebruiken, zodat zij een request naar /somepage?het_id=id-van-sectie oid kunnen doen en alsnog de bijbehorende content erin kunnen schieten.

Ik zie wel een voor de hand liggend probleem: hoe weet de spider WAAR-ie die content moet inserten? Maar belangrijker: je HEBT de html van die pagina al, dan kun je toch gewoon 'zien' dat er geen named anchor met id-van-sectie is en je die dus moet gebruiken? Dan is het alleen nog een kwestie van iets afspreken waarmee je dat dan moet ophalen. Dat zou ik persoonlijk liever in b.v. een meta-tag of (misschien theoretisch nog beter, al is het geen standaard) een toevoeging aan robots.txt defineren, dat lijkt me wel redelijk flexibel.

Dan nog hou je overigens het eerste probleem, en ik weet niet of daar echt makkelijk omheen te werken is. Veel Ajax geeft immers iets van een JSON-object terug, en for all you know wordt op 16 plekken op de pagina verwerkt.

Alternatief beter voorstel: een nette Ajax-applicatie vangt onload een evt. fragment al af om daar iets mee te doen (voor gebookmarkte pagina's). Als Google dat graag wil indexeren vragen ze die pagina toch opnieuw op met fragment en steken ze zelf wat moeite in een javascript-parser? Techniek is er al, wordt ook al zo geimplementeerd en is ook waar fragments voor dienen. Problem solved!

NULL op Vrijdag 9 Oktober 2009 18:37

image

Als bedrijven te stom zijn om een niet-indexeerbare site te maken en/of van obtrusive javascript gebruikmaken, dan is hun content waarschijnlijk ook het bekijken niet waard. Ik zou blij zijn als die rommel ook niet in de resultaten zoekmachines terugkomt. Er is al genoeg drek om doorheen te worstelen als je iets zoekt tegenwoordig :(

jimmie4666 op Zaterdag 10 Oktober 2009 02:50

image

*** reactie verwijderd ***

spatieman op Zaterdag 10 Oktober 2009 10:50

image

en wat als je NIET wilt dat je door elke zoekmachine gevonden wilt worden ???

burne op Zaterdag 10 Oktober 2009 11:02

image

http://en.wikipedia.org/wiki/Robots_exclusion_standard legt je keurig uit hoe en wat.

spatieman op Zaterdag 10 Oktober 2009 10:52

image

redactie , kan jimmie4666 niet geband worden met zijn reklame berichten.
in iedere topic zie ik die gast terug komen..

Tom Sanders op Zaterdag 10 Oktober 2009 15:37

image zomerhack badge 2

User is geband, reacties zijn verwijderd.
Dank voor de melding

Tom Sanders
Webwereld

Om te kunnen reageren, dient u ingelogd te zijn.

Nieuwsbrief

Ontvang dagelijks een overzicht van het laatste ICT-Nieuws in uw mailbox

Peiling

Loading Poll

Video: World Tech Update: Darpa's robot oorl...

World Tech Update: Darpa's robot oorlogspaard (video)

Verleden nieuws