La nouvelle a été reprise par beaucoup de monde, Google index 1000 milliard d'URL.
Le Web a beaucoup plus d'Url donc tout le monde pense que l'annuaire de Google est incomplet.
En réalité c'est un petit peu plus compliqué. Il ne sert a rien de garder dans l'index des liens qui ne ressortiront pas dans le moteur de recherche.
L'intelligence c'est plus l'oubli que la mémoire, l'exhaustivité son ennemie. L'oubli ne doit bien sur rien au hasard, il faut oublier ce qui ne sert pas. cf : Interactions humaines dans les réseaux.
Chercher a avoir le plus gros index ne veut pas dire que l'on va améliorer le résultat des recherches. Il est fort probable que seules quelques millions d'url servent en pratique dans les résultats de recherche de 99,99% des cas.
Le même réflexe existe chez beaucoup de clients qui gardent dans les applications des données très anciennes. Croire qu'elles servent est une erreur, un client qui a fermé son compte va devoir le réouvrir avec un nouveau dossier... par contre ça complique tout car les données créées il y a 10 ans ne l'ont peut être pas étés avec le modèle de donnée actuel... il faut donc garder des règles de gestion ... Il faut retirer les données inutiles dans systèmes ... et les laisser aux statisticiens de l'entreprise.
dimanche, juillet 27, 2008
Inscription à :
Publier les commentaires (Atom)

0 commentaires:
Enregistrer un commentaire