 |
Le fonctionnement d'un moteur de recherche se décompose en trois étapes principales.
Le Web est systématiquement exploré par un robot d'indexation suivant récursivement tous les hyperliens qu'il trouve et récupérant les ressources jugées intéressantes. L'exploration est lancée depuis une ressource pivot, comme une page d'annuaire Web.
L'indexation des ressources récupérées consiste à extraire les mots considérés comme significatifs (pratiquement tous) correspondant à chaque ressource.
Les mots extraits sont enregistrés dans une base de données organisée comme un gigantesque dictionnaire inverse. La partie requêtes du moteur de recherche peut ainsi rapidement retrouver les correspondances.
Un algorithme gardé secret est généralement appliqué pour donner un poids variable aux correspondances, afin de pouvoir présenter les résultats des recherches par ordre de pertinence supposé. L'algorithme tient généralement compte du contexte du mot clé (titre, paragraphe, hyperlien...) et de la ressource (ressources liées, popularité du site...)
La ressource indexée peut ensuite être retournée dans les résultats d'une recherche d'un visiteur contenant un mot clé correspondant.
Outil de recherche sur le Web constitué de "robots", encore appelés spiders, crawlers ou agents qui parcourent les sites à intervalles réguliers et de façon automatique (sans intervention humaine ce qui est le cas des annuaires) pour découvrir de nouvelles adresse (URL). Ils testent tous les liens hypertextes (mots qui relient les textes entre eux) rencontrés sur chaque page atteinte. Chaque page identifiée est alors indexée dans une base de donnée.
Moteur de recherche
Définition
Fonctionnement
Financement
Publicité
Vente de technologie
|
 |