Mise à jour Pingouin 3.0 : comprendre l’algorythme

mise-a-jour-pingouin-3.0-octobre-2014

Le lancement de la troisième version de Pingouin / Penguin 3.0 vendredi 17 octobre 2014 à relancer la discussion concernant cet algorythme dans le milieu du SEO. Une parfaite occasion de rafraichir nos connaissances concernant le filtre de Google lancé pour la première fois en 2012, les pénalités éventuelles et les moyens connus et bonnes pratiques pour les éviter.

Historique des modifications

Ci-dessous un petit aperçu des dates des mises à jour connues de l’algorithme :

  • 24 avril 2012 : lancement de Pingouin 1.0
  • 26 mai 2012 : Pingouin 1.1
  • 5 octobre 2012 : Pingouin 1.2
  • 22 mai 2013 : Pingouin 2.0
  • 4 octobre 2013 : Pingouin 2.1
  • 17 octobre 2014 : dernière version à date (3.0)

Concernant les appellations, je suis d’accord il « manque des étapes » pour passer 1.2 au 2.0 puis du 2.1 et 3.0, mais bon mettons cela sur le compte de l’excitation et du changement d’année 🙂

Fonctionnement général du filtre

L’algorithme Pingouin a été développé par Google dans le cadre de sa lutte contre le spamdexing. Il vise la détection et le repérage des sites internet présentant une suroptimisation dans le cadre de stratégies de netlinking artificiel. Une fois ces domaines détectés, il leur inflige une pénalité variable en fonction du degré de gravité des techniques utilisées.

En pratique, ce filtre algorithmique cherche à identifier les liens factices ou backlinks artificiels, ces derniers n’étant pas conformes vis-à-vis des bonnes pratiques édictées par Google. D’après ces règles, les liens externes doivent en effet se développer de façon naturelle. D’où le terme référencement naturel 🙂

Pour utiliser une image grossière, Pingouin c’est un peu comme un policier enquêtant sur un trafic de drogue : il cherche des indices pour identifier les dealers (fermes de liens, sites pratiquant le scrapping, etc.), examine les transactions (backlinks) et cherchent à identifier les clients. Une fois qu’il a remonté la piste, tout le monde est embarqué au commissariat et des sanctions sont appliquées. L’exemple est un peu extrême mais vous comprenez le message.

Les nouveautés avec la troisième version ?

Dans l’absolu Pingouin 3.0 ne change pas vraiment la donne puisqu’il ne s’agit que d’un rafraichissement des données existantes (cf. Pierre Far, Webmaster Trend Analyst chez Google). Pas de refonte algorithmique donc ou d’effet « ouragan » dans le monde du référencement comme lors du lancement de la version 1.0 mais simplement une mise à jour des données.

Alors si Pingouin 3.0 ne présente que si peu de changement, pourquoi est-ce que les référenceurs et la communauté SEO en général s’agitent-ils (moi y compris) ? Pour la bonne et simple raison qu’il s’agit de la première évolution de l’algorithme depuis plus d’un an – la précédente version 2.1 datant d’octobre 2013. Et vu les conséquences que cette dernière avait eu pour certains webmasters, cela est suffisant pour faire réfléchir n’importe quel référenceur 🙂

En bref et avec quelques semaines de recul voici les principaux aspects de cette nouvelle mouture du manchot :

  • cette mise à jour est mondiale a été appliquée à toutes les versions du moteur de recherche Google
  • le déploiement est progressif, c’est à dire étalé sur plusieurs semaines
  • l’impact semble très modérée avec moins de un pourcent (1%) des requêtes en anglais, voire moins pour les autres langues
  • Pierre Far nous indique que cette version devrait permettre de mieux identifier les sites présentant de mauvais backlinks mais aussi faciliter le rétablissement des domaines préalablement touchés par une pénalité pingouin.

Cette dernière affirmation est en soi une très bonne nouvelle, Pingouin ayant dans ses premières versions pénalisé un grand nombre de sites, dont certains entraient dans la catégorie des « dommages colatéraux ».

Quelle différence avec Panda ?

En fait les algorithmes Panda et Pingouin ne poursuivent pas les même objectifs et ne visent pas les mêmes pratiques « black hat ». Leurs critères peuvent se croiser en apparence, mais leurs éventuelles pénalités n’impacteront pas les mêmes sites – ou pas pour les mêmes raisons – et pas de la même façon !

Pingouin vise la détection des sites générant ou bénéficiant de liens « spammy », en s’intéressant au contenu du domaine source et à la nature des liens existants. Il cherche à identifier les domaines conçus pour la production de backlinks ainsi que les cibles de ces backlinks.

Panda a quant à lui une fonction de contrôle de la qualité du contenu web en vue de maximiser l’expérience utilisateur des internautes. Il vérifie la qualité du contenu rédactionnel des sites internet examinés. Il va sanctionner entre autres la duplication de contenu (duplicate content) ou encore les techniques de type content spinning ou autre.

Quelques critères pris en compte par Google

Pour simplifier grossièrement le fonctionnement de cet algorithme, Pingouin cherche à déterminer si un backlink agit de façon bénéfique ou néfaste (spam) sur la pertinence de ses résultats de recherche. Il va ainsi s’attacher à examiner plusieurs critères touchant ledit backlink, notamment :

L’environnement sémantique dans lequel le backlink « évolue » : cet environnement comprend bien évidemment le domaine, mais également le contenu textuel de la page sur laquelle le backlink apparait. Une page présentant une richesse sémantique, avec l’emploi de mots clés spécifiques/ rares, des phrases longues, des mots complexes, etc. constituera un environnement de meilleure qualité et donc réduira les chances de pénalités Pingouin.

Le texte des ancres utilisées : des liens présentant des ancres textuelles identiques, contenant de façon répétitive les mêmes séquences de mots-clés constituent un facteur déclenchant.

L’environnement externe dans lequel s’imbrique le domaine : la présence d’un nombre important de liens sur un seul ou sur plusieurs domaines hébergés sur une même IP peuvent indiquer le caractère artificiel et donc pénalisant d’un réseau de liens.

Gardez-bien ces critères à l’esprit pour votre stratégie de netlinking, une pénalité est vite arrivée en cas de campagnes mal menées.

Pratiques pénalisantes et SEO Black Hat

L’une des conséquences principales de la mise en place du filtre Pingouin a été l’abandon progressif des pratiques de netlinking jugées « spammy » par Google. Evitez ainsi à tout prix d’inclure dans votre stratégie de référencement de site internet :

  • les backlinks payants : affirmation à modérer, puisque encore faut-il que Google est la possibilité de déterminer que le lien incriminé a bien été acheté… nous parlons ici de backlinks ostensiblement payants, achetés auprès d’un domaine connu par les moteurs de recherche pour cette pratique.
  • les inscriptions en annuaires de basse qualité : un grand classique, les offres « magiques » du style mille inscriptions en annuaires pour cinquante euros ont fort heureusement tendance à disparaitre. Et pour cause, les annuaires les proposant sont aisément détectés par ce filtre.
  • les systèmes de liens artificiels : là encore merci d’appliquer une grosse modération vis-à-vis de cette remarque, je parle ici des liens véritablement artificiels ou produit à la chaine. Nous parlons ici typiquement des échanges de liens à foisons avec ancres suroptimisées et identiques, de la création de constellation de sites internet truffés de mots-clés type EMD (exact match domain) ou encore de réseaux pyramidaux poussés à l’extrême. Comme souvent en SEO, tout est une question de dosage.

Pénalités et sanctions éventuelles

Tel qu’indiqué par Google via son centre d’aide aux webmasters, trois conséquences sont envisageables dans le cas où une pratique de netlinking pénalisante serait détectée :

  • Action manuelle : comme son nom l’indique, il s’agit là d’une action effectuée manuellement par un « Googler » ; le domaine touché est alors averti par le biais de sa console Webmaster Tools (à condition d’avoir créé son compte GWT bien évidemment)
  • Sanction algorithmique : l’essence de Pingouin, c’est à dire la détection automatique d’une pratique s’apparentant à du spam et l’application d’une sanction. Ceci se solde généralement par une perte de positionnement pour une ou plusieurs expressions
  • Retrait permanent du domaine incriminé des résultats de recherche : cas extrême que je cite mais que je n’ai jamais rencontré jusqu’à présent

Sans être « commercial », le développement de l’autorité d’un site et de sa réputation sur internet (liens externes) est rééllement une affaire de spécialiste, essayez donc si votre budget vous le permet de faire appel à une agence SEO ou un consultant en référencement.

En savoir plus – revue de presse :

Un commentaire ?