'WWW telt 14,3 miljard webpagina's'

Athlon_2o0o
Icoon Internet Het world wide web telt zeker 14,3 miljard webpagina's. Het Nederlandse web bestaat uit 291 miljoen webpagina's. En het world wide web groeit met 2 procent per maand. Dat beweert de Tilburgse student Maurice de Kunder, die zijn scriptie aan het onderwerp gewijd heeft. De Kunder is bijna afgestudeerd aan de studie bedrijfscommunicatie en digitale media op de Universiteit van Tilburg.

Hij heeft niet één voor één alle webpagina's geteld, maar een systematische methode gebruikt om het aantal webpagina's te berekenen. De methode gaat uit van woord- en documentfrequenties in verschillende tekstverzamelingen. Een voorbeeld: als een woord in dertig artikelen voorkomt in een verzameling van 30.000 krantenartikelen, dan is de verwachte documentfrequentie van dat woord 1 op 1000. Wanneer een zoekmachine meldt dat er 9 miljoen webpagina's zijn waarop dat woord voorkomt, dan is het aannemelijk dat er 9 miljard webpagina's te zien zijn.

De Kunder herhaalde zijn formule voor een groot aantal woorden en kon zo de omvang van de database van de zoekmachines Google, Yahoo Search, MSN Search en Ask schatten. Maar omdat veel sites in meerdere zoekmachines terecht komen moest de student via een steekproef de overlappingen eruit halen.

Google geeft, als het gaat om de omvang, zeer uiteenlopende resultaten, zo vond De Kunder uit. De grootte van de database varieerde tussen de 25 en 45 miljard webpagina's. Hoofddocent Antal van den Bosch beweert dat Google op drukkere tijden een kleinere database inzet. De Kunder vindt daarom dat Yahoo Search de omvang van het web het beste weergeeft.