Définition : Un moteur de recherche (Search Engine) est un outil qui parcoure le web et indexe automatiquement le contenu qu’il visite. Il permet d’accéder à différentes ressources comme des textes, des vidéos, des images, de la musique, …

Lorsque l’internaute effectue une recherche, le moteur lui retourne une liste de résultats classés selon leur pertinence avec la question posée.

Les moteurs de recherche sont la principale source de trafic sur votre site. Il est donc primordial d’optimiser votre référencement naturel pour qu’il obtienne une meilleure visibilité.

Sur internet, un moteur de recherche réalise 3 principales tâches :

  1. Exploration du web par ses robots (spider, crawler)
  2. Indexation de contenus
  3. Recherche dans son index

Publicité sur internet, mais pas que

Initialement, l’objectif des moteurs était d’apporter les meilleurs résultats recherchés par l’internaute. Mais pour se maintenir à flot, il leur a fallu trouver un moyen de monétiser leur activité. Aujourd’hui, c’est de la pub que provient la très grande majorité de leur revenu.
(Plus de 98% dans le cas de Google)

La publicité web se fait sur les moteurs (principalement Google Adwords) mais aussi sur des sites qui parlent de vous, des newsletters, des sites d’annonces, … Soit, tout internet ai aujourd’hui source potentielle de publicité.

Mais attention, trop de pub tue la pub ! Ne cherchez pas à vous faire connaître sur une page web où tout le monde est déjà présent. Votre message tombera dans les oublis et n’aura que très de résultats sur votre référencement naturel. Ciblez la qualité de vos supports et sponsors.

1- Exploration du web par un robot

Les moteurs de recherche utilisent des robots, aussi appelés web spiders ou crawlers, qui suivent les liens qu’ils trouvent sur internet. Durant leur parcours, certaines ressources seront indexées et d’autres seront rejetées ou mise en retrait de l’index. Une non-indexation peut résulter de :

  • Refus explicite du webmaster de se faire indexer sur internet (<meta name=’robots’ content=’noindex’)
  • Notion de ‘contenu dupliqué’ (il peut alors y avoir indexation  mais mise en retrait du résultat)
  • Tentative de spamdexing (référencement par des méthodes interdites pas les moteurs)

2- Indexation de contenus internet

Le contenu de chaque page web parcourue est analysé pour déterminer comment l’indexer. Les informations recueillies sont alors conservées dans une base de données. Les moteurs de recherche comme Google mémorisent toute une page ou seulement une partie alors que d’autres enregistrent systématiquement leur entièreté.

Lors de l’indexation d’une page internet, l’outil donne une valeur à chaque terme significatif. Cette valeur, ce poids, dépend de l’importance relative de ce mot clé dans le document (utilisation dans le titre, mise en évidence, fréquence d’utilisation, …, ancres des liens menant vers la page, popularité, signaux d’intérêt d’autres sites, …).

3- Recherche dans l’index d’un moteur de recherche

L’internaute interroge un moteur de recherche au moyen d’une requête. Cette requête correspond à une suite de mots clés. Le moteur explore alors son index et retourne une série ordonnée de ressources se rapportant à cette recherche. Ces résultats sont généralement composés d’un titre (balise <title>) et d’une description issue de la balise méta description ou du contenu visible sur la page.

Moteur de recherche sémantique

L’analyse sémantique utilise l’occurrence de termes similaires dans la recherche de résultats. Cette évolution vise à améliorer les résultats présentés par un moteur de recherche en se focalisant sur le sens d’une requête et non strictement sur l’expression recherchée. Le mot ‘voyage’ est ainsi automatiquement associé à des termes sémantiquement proches comme ‘vacances’.

Annuaire

A tord, les annuaires (directory) sont souvent assimilés aux moteurs de recherche. Au contraire des moteurs, ils sont créés manuellement. Ce sont des personnes, et non des robots, qui parcourent internet et référencient dans leur annuaire des sites jugés pertinents pour leur thématique.

Cet outil réalise un inventaire, généraliste ou spécialisé, qui répertorie des sites classés par catégories. Il existe par exemple d’annuaires spécialisés sur la Belgique, les produits durables ou la photographie. Un annuaire est ainsi composé d’un nombre importants de liens hypertextes menant vers d’autres sites web ou catégories de l’annuaire.

Principaux moteurs de recherche

Google est incontestablement le moteur le plus populaire, avec plus de 90% des parts de marché en Belgique, et dans la francophonie. Google ne dispose cependant pas de cette importance dans toutes les régions du monde.

Autres grands outils de recherche : Yahoo, Bing (Microsoft), Exalead, Baidu, …,

Moteurs moins connus mais apportant des résultats pertinents Mozbot, … et des metamoteurs : Zuula,Mamma, …