Wat doet een zoekmachine?

Berners-Lee had - toen hij het www ontwikkelde begin de jaren '90 – wellicht nooit voorzien dat twintig jaar later het internet zo gigantisch groot zou zijn als vandaag de dag. En iedere dag opnieuw rijzen er nog eens ontelbaar nieuwe webpagina's als paddestoelen uit de grond, de ene met al wat meer kwalitatieve inhoud als de andere. Probeer hier maar eens te vinden wat je zoekt zonder gebruik te maken van een zoekmachine.

Dat er zoiets bestaat als een zoekmachine is dus gegarandeerd iets dat toe te juichen valt, ook al beschikken ze op deze manier aan enorme schatten van informatie over onze persoonlijke interesses. Maar daarnaast zorgen ze er dus wel voor dat we bepaalde informatie relatief eenvoudig kunnen terugvinden.

Googlebot: de spider van Google
Googlebot

Web crawling

Om dit te kunnen doen, moet een zoekmachine op de hoogte blijven van alle webpagina's die het internet rijk is. Dit doen ze aan de hand van een crawling spider, een computerprogramma dat als enige taak heeft het ontdekken van nieuwe inhoud en webpagina's. De spider van Google is ook beter gekend onder de naam van Googlebot. Deze "doorleest" de reeds gekende webpagina's en volgt de daarop voorkomende links om daarnaast ook nieuwe webpagina's te vinden. Dit proces noemt men het indexeren van webpagina's. De verzamelde informatie wordt vervolgens opgeslagen in een gigantische kennisdatabank, die wordt geraadpleegd bij iedere nieuwe zoekopdracht.

Zoekalgoritme

Voor iedere aparte zoekopdracht bestaat er dus een enorme hoeveelheid pagina's met mogelijk nuttige inhoud. Het is echter de taak van de zoekmachine om hieruit de meest relevante en kwaliteitsvolle uit te zoeken en bovenaan de resultatenpagina weer te geven.

Hiervoor maken ze gebruik van speciaal daarvoor ontwikkelde en redelijk complexe zoekalgoritmes. Google Hummingbird bijvoorbeeld – het nieuwe zoekalgoritme van Google – maakt naar eigen zeggen zo maar liefst gebruik van meer dan 200 afzonderlijke criteria om de kwaliteit van een afzonderlijke wegpagina te achterhalen.

Op deze pagina vind je bovendien een handig overzicht van een heleboel (mogelijk) invloedrijke factoren.