Introduction à la SEO (optimisation de pages Web)


précédentsommairesuivant

II. Glossaire

II-A. Acteurs

Nous ne nous intéresserons pas tant aux annuaires qu'aux moteurs de recherche. Voici néanmoins une courte présentation des deux acteurs du référencement sur le Web :

Annuaire (directory)

L'organisation des sites s'y fait au moyen d'une hiérarchie thématique.
L'inscription d'un site auprès d'un annuaire est faite par quelqu'un (le webmestre, un utilisateur ou bien un programme automatisé). Certains annuaires se spécialisent dans un thème précis (la recherche, la cuisine, etc.) tandis que d'autres préfèrent gérer toutes les situations.

Voici quelques exemples d'annuaires :
  • http://www.webdirectory.com/
  • http://search.yahoo.com/dir
  • http://directory.google.com/

Ces annuaires disposent d'un moteur de recherche interne par mots clefs mais cela ne permet pas de les considérer comme des moteurs de recherche (cf. définition suivante).

Globalement, la plupart des sites communautaires (dont les fournisseurs d'accès à Internet font partie au travers des pages perso de leurs abonnés) proposent une organisation hiérachique sur ce principe.

Moteur de recherche (search engine)

L'organisation des sites s'y fait au moyen de mots clefs.
L'inscription d'un site auprès d'un moteur de recherche est automatiquement faite par le robot du moteur en question.

Voici quelques exemples de moteurs de recherche :
  • http://www.altavista.com/
  • http://search.yahoo.com/web
  • http://www.google.com/
  • http://search.msn.com/

II-B. Termes

Backlink

C'est la fondation du PageRank de Google. Un backlink est un lien pointant vers la page que nous souhaitons optimiser. L'idée générale est que chaque lien vers une page est considéré comme un vote en sa faveur. Bien entendu, c'est plus complexe que cela en réalité : Google utilise un grand nombre de paramètres pour déterminer la valeur (le poids) de chaque lien.

Robot / bot / Web crawler / spider

Tous ces termes sont équivalents.
Ils désignent des programmes ou des scripts exécutés par les serveurs des moteurs de recherche. Les spiders (c'est mon terme favori) lisent le code source des pages Web (il s'agit généralement de HTML mais ce n'est pas toujours le cas), en analysent le contenu, en extraient les hyperliens et recommencent l'opération (sur chacun de ces hyperliens) afin de parcourir la Toile peu à peu.

Une note de sémantique :
  • "web" signifie "toile" (notion de réseau comme pour les toiles d'araignées)
  • "spider" signifie "araignée"
  • "to crawl" signifie "ramper"

SEO (Search Engine Optimization, optimisation pour les moteurs de recherche)

Ce sont toutes les techniques permettant d'améliorer le positionnement d'une page Web dans les résultats d'une recherche. Attention, il ne s'agit que d'optimisation (amélioration) : les techniques artificielles (factices) sont dénommées spamdexing.

Spamdexing

C'est de la SEO qui a été poussée trop loin : l'optimisation est devenue mensonge.

Il peut s'agir de :
  • propriétés CSS permettant de cacher de grandes quantités de texte et/ou de le positionner hors de l'écran (le visiteur ne voit pas ce texte mais le spider le repère et l'analyse, ce qui permet d'ajouter sournoisement des mots clefs à une page)
  • fermes de liens (augmenter le nombre de backlinks)
  • etc.

II-C. Algorithmes

Il s'agit des divers algorithmes permettant de classer les pages Web selon leur fiabilité. Ce classement (propre à chaque moteur) est consulté à chaque fois qu'un internaute effectue une recherche.
Chaque moteur a son algorithme et les détails en sont secrètement gardés.

PageRank (Google)

Le principe de base du PageRank est extrêmement simple : un lien représente, dans la majeure partie des cas, une volonté de son auteur de montrer à ses visiteurs une page qu'il estime intéressante. Plus il y a de liens vers une page précise, plus cela signifie que des gens l'ont trouvée intéressante. Les backlinks sont donc le coeur du PageRank ; Google calcule ensuite une moultitude de paramètres (plus de 200, semble-t-il) afin de déterminer quelle valeur (quel poids) peut avoir un backlink : c'est ce qui est gardé secret.
Tout est automatisé : c'est d'ailleurs le problème du PageRank. Google y tient fermement et lutte activement contre le spamdexing.

Schéma simplifié du PageRank de Google
Schéma simplifié du PageRank de Google


Ce schéma illustre deux choses : d'une part, l'objectif du PageRank est de donner une sorte de note à une page Web ; d'autre part, cette note dépend de paramètres propres à la page ainsi que de la note attribuée aux backlinks de la page. Cela signifie qu'un grand nombre de backlinks permet plus facilement d'obtenir un classement correct.
La valeur du vote d'un backlink pour sa page de destination dépend directement du classement de la page hôte de ce backlink ainsi que de la manière dont il est formé.

TrustRank (Yahoo! Search)

Le cas du TrustRank est différent : il s'agit également de compter les backlinks mais leur valeur dépend principalement de l'éloignement à une page source. Le postulat est le suivant : nous examinons attentivement une page à la main ; toute la suite repose sur la confiance que nous accorderons à cette page ; les liens provenant d'une page digne de confiance sont, a priori, dignes d'une confiance similaire ; au fur et à mesure que les liens nous éloignent de la page d'origine, nous ne pouvons plus leur accorder autant de confiance.

Selon René Descartes, toute chose provient d'une chose au moins aussi parfaite. On peut remonter l'arbre généalogique de quelque chose et ainsi découvrir des choses de plus en plus parfaites.
Le TrustRank fonctionne sur ce principe : prendre une chose parfaite comme point de départ et s'en éloigner peu à peu. Chaque génération perd en perfection, en crédibilité.

Schéma simplifié du TrustRank de Yahoo!
Schéma simplifié du TrustRank de Yahoo!


Le TrustRank accorde de moins en moins de valeur aux backlinks au fur et à mesure que leur site hôte est éloigné du site de référence.
Bien entendu, une même page peut avoir plusieurs backlinks : cela lui permet d'améliorer sa popularité.


précédentsommairesuivant

Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants : Viadeo Twitter Facebook Share on Google+   

  

Copyright © 2006 Guillaume Rossolini. Aucune reproduction, même partielle, ne peut être faite de ce site et de l'ensemble de son contenu : textes, documents, images, etc. sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.