SEO : pourquoi/ comment éviter le contenu dupliqué ?

visuel-billet-duplicate-contentUne discussion avec un client il y a quelques semaines dans le cadre de la création de son site internet :

Gothuey Consulting : « nous allons tenir les délais concernant le développement et pourrons donc livrer le site à la date prévue. Par contre nous n’avons toujours pas reçu le contenu des pages web de votre part… »

Client : « oui je sais nous n’avons pas le temps. En ce moment nous sommes en train de préparer la rentrée. Je crois que je vais juste faire du copier-coller sur d’autres sites, ça va le faire personne ne viendra vérifier… »

Pour reprendre l’expression, cela « ne va pas le faire du tout » et pour cause. Le contenu dupliqué s’il concerne un site dans sa globalité entraine purement et simplement le non affichage du domaine dans les moteurs de recherche (à moins de taper le nom de domaine !). Petit résumé ci-dessous de l’explication fournie à mon client.

Le duplicate content, kesaco ?

Généralement appelé « duplicate content », le contenu rédactionnel dupliqué est l’une des problématiques principales dans le cadre du référencement internet. En résumé, il s’agit de la présence sur un ou plusieurs domaines de portions de texte identiques.

Il s’agit d’un phénomène particulièrement courant dans :

  • les problématiques techniques où il est difficile de « broder »
  • les sites marchand/ e-commerce présentant plusieurs milliers de fiches produits
  • les sites faisant partie d’une même franchise et proposant donc les mêmes prestations

Attention cependant, je ne parle pas ici du duplicate content « accidentel » du à la génération d’URLS multiples pour un même contenu rédactionnel (problème courant sur les sites marchands) joliment appelé DUST (Different URLs with Similar Text).

Quelle(s) conséquence(s) ?

L’impact du duplicate content sur le positionnement d’un site web dépend de nombreux critères, notamment :

  • Le volume de texte dupliqué
  • L’aspect total ou partiel de la duplication
  • La source originelle dudit contenu, à savoir le domaine audité OU un domaine tiers
  • La nature du domaine : site vitrine, boutique en ligne, ferme de liens, forums…
  • Etc.

Conséquences courantes

Les conséquences de la présence de contenu dupliqué varient grandement. Google rappelle à ce sujet régulièrement que le duplicate content ne constitue pas en soi un facteur de pénalisation/ pénalité :

  • Aucune pénalité : dans le cas d’une duplication jugée « accidentelle », la page concernée n’est simplement pas affichée en index principal, et passe en index secondaire (la petite ligne en bas des résultats de recherche disant « certains résultats de recherche similaires ont été ignorés… »)
  • Pénalité : généralement appliquée aux sites de type fermes de liens qui copient à grande échelle le contenu des sites répertoriés.

Quelques solutions

Si vous n’êtes pas le rédacteur originel du contenu :

  • Ne copiez pas, réécrivez 🙂
  • Contrairement aux idées reçues la réécriture (rewriting en anglais) est un processus assez rapide une fois que vous en avez l’habitude. Avoir un contenu réellement unique n’a pas de prix en référencement, prenez donc le temps de le faire.
  • Note : éviter d’utiliser des outils automatiques de type « content spinning » pour réécrire vos pages, le résultat étant généralement désastreux d’un point de vue utilisateur
  • Citez les sources/ références
  • Si vous êtes le rédacteur originel du contenu :

    • Mettez à jour votre sitemap régulièrement
    • Disposez des balises canonical dans la section Head de vos pages, afin d’indiquer aux moteurs quelle URL devrait être considérée comme la source originelle
    • Déclarez / demandez l’indexation de la/ les page(s) nouvellement mise en ligne aux moteurs de recherche. Inutile de faire la demande à tous les moteurs, les trois principaux en France et en Belgique suffisent (Google, Yahoo, bing) voire uniquement Google. De cette façon vous vous assurez que votre site internet soit historiquement considéré comme la source du contenu ainsi publié
    • Dans le cas d’une page d’un site vitrine ou d’un blog (billet), n’hésitez pas à poster un lien par le biais de vos comptes Facebook, Twitter et autres : ces plateformes sont crawlées régulièrement par les robots, ce qui permettra encore une fois d’entériner votre site comme source originelle (canonique) du contenu rédactionnel

2 Commentaires

  1. Bonjour,

    En effet, il est vivement déconseillé de recopier le contenu d’autres sites, pour les raisons que vous énoncés, mais aussi parce que c’est tout simplement du vol.
    J’ai eu une cliente qui voulait s’y risquer, mais j’ai refusé. Elle est alors allé voir ailleurs et elle a trouvé un webmaster sans scrupule qui a tout pompé sur différents sites, y compris les photos pour alimenter la boutique en ligne qui …. ne ressemble vraiment à rien.
    Bref, je pense qu’elle ne va malheureusement pour elle pas faire long feu.

    Cordialement,

    Bruno

    Répondre
    • Bonjour Bruno,

      Oui effectivement il est souvent difficile de comprendre la valeur du rewriting au client, qui généralement se concentre plus sur l’aspect technique qui a un aspect « pilule magique » (ne parlons même pas du netlinking). C’est l’aspect pédagogique du travail 😉

      Bien à vous,

      Jean-Francis

      Répondre

Un commentaire ?