Hoe kan je eigen informatie op Google Maps publiceren (2): Webcrawler

Dit artikel gaat over de bedrijfsinformatie die Google krijgt d.m.v. hun Webcrawlers (Spiders). Daarnaast gaat het ook in op het gebruik van adressen op een website. h3. Webcrawler

In het Google Maps Helpcentrum geeft Google aan dat een van de bronnen voor de informatie in Google Maps de Google web-zoekindex is. Deze zoekindex wordt samengesteld door de informatie die de Google Webcrawlers tegenkomen op het Internet.

Het is onduidelijk of de spiders echt gericht zoeken naar adressen op webpagina’s. Een andere mogelijkheid is dat de crawl resultaten alleen gebruikt worden in de tab “Webpagina’s”, die je krijgt als je op ‘Meer informatie’ klikt bij een Google Maps zoekresultaat.

Screenshot van het Google Maps info window

HTML adres tag

Zoeken naar adressen op webpagina’s kan lastig zijn. Er is een HTML ‘address’-tag, maar wat er precies in die address tag staat is niet gedefinieerd.

Mocht Google deze informatie gebruiken, dan moeten ze een intelligente manier gebruiken om het te koppelen aan het juiste adres.

hCard

Er is een slimmere manier om adres informatie op een website te publiceren en dat is m.b.v. de hCard Microformat specificatie. Een voorbeeld hiervan is te vinden op de contact pagina van deze website:


<div class="vcard">
  <span class="fn org">Million Pieces</span>
  <div class="adr">
    <div class="street-address">Kiekstraat 167</div>
      <span class="postal-code">1087 GT</span> 
      <span class="locality">Amsterdam</span>
    <div class="country-name">Nederland</div>
  </div>
  <div class="tel">
    <span class="type">work</span>
    <span class="type">cell</span>
    <span class="type">pref</span>
    <span class="value">+31 6 18376041</span>
  </div>
  <a class="email" 
href="mailto:info@millionpieces.nl">info@millionpieces.nl</a>
</div> 
 

hCard is een specificatie die gebruikt kan worden om gestructureerde (en semantisch correcte) adres informatie op een webpagina te plaatsen. Het maakt gebruik van een verzameling van css class namen. Een introductie van Microformats is te vinden op de microformats website.

Ook al is het niet bekend of Google op dit moment hCard gebruikt (waarschijnlijk niet), ik denk dat het belangrijk is om het te gebruiken op je website. Waarom? Hier zijn een aantal redenen:

  1. Google kan het gaan gebruiken – Zal dit snel gebeuren? Geen idee, maar als het gebeurt kan je er maar beter op voorbereid zijn.
  2. Andere zoekmachines kunnen het gaan gebruikenTechnorati is op dit moment al aan het experimenteren met een gespecialiseerde zoekmachine voor Microformats. Deze zoekmachine kan gebruikt worden om naar contact informatie te zoeken.
  3. Browser plugins kunnen hCard informatie herkennen – Er is een goede Microformats plugin voor Firefox: Operator en voor Safari is er een bookmarklet. Firefox 3 zal standaard met Microformats kunnen omgaan en waarschijnlijk zullen andere browsers volgen.

Conclusie: Als je website adres informatie bevat, waarom geen hCards gebruiken?

Deze post is meer een Microformats promotie geworden, maar het volgende artikel in de serie zal volledig over Google Maps gaan. Het onderwerp is: Lokale data leveranciers.