Rich snippets & données structurées Schema.org

Depuis l’arrivée du HTML5 (2011), l’utilisation des données structurées et la notion de balisage sémantique ont fait leur « petit bonhomme de chemin ». Ces deux aspects font désormais partie intégrante de toute stratégie de référencement naturel en 2015.

Argument expliquant leur popularité auprès des référenceurs, ces données permettent notamment d’afficher dans les résultats des moteurs de recherche des extraits enrichis – également appelés Rich Snippet. A la clé, une vignette au visuel très attractif permettant de sortir du lot et un taux de clic largement supérieur aux snippets traditionnels. De quoi motiver les responsables emarketing !

Table des matières

  1. Que sont les données structurées ? (définition)
  2. Les formats compatibles avec les extraits enrichis en 2015
  3. Schema.org, le « format de Google »
  4. Rich snippet : checklist des principales utilisations
  5. Application au référencement local
  6. Intégration technique : mettre en place les balises
  7. Outils de test d’affichage des rich snippets dans les SERPS
  8. Pour aller plus loin : liens utiles

1/ Que sont les données structurées ? (définition)

Innovation apparue avec le langage HTML5, les données structurées sont prises en compte par les trois principaux moteurs de recherche occidentaux – Google, Yahoo et Bing.

Dans le cadre de leur application au SEO, les microdonnées permettent d’effectuer un balisage sémantique d’une page web. Autrement il permet d’ajouter une forme de libellé à un élément du contenu rédactionnel pour en expliciter la nature/ l’objet. Par exemple vous pouvez ainsi indiquer l’auteur d’une page, sa date de naissance, son employeur, etc. En ce sens les microdonnées permet de cartographier son contenu rédactionnel, et de facilité son analyse/ compréhension par les moteurs.

Les données structurées sont devenues un élément incontournable de l’optimisation sémantique d’un site internet. Elles permettent un travail tant au niveau du positionnement/ ranking mais aussi de l’affichage dans les SERPS et donc du taux de clic :

Positionnement/ Ranking :

Les données structurées peuvent de faciliter le crawl et l’indexation du contenu et par extension de faciliter la tâche aux moteurs de recherche.

Affichage dans les SERPS :

Il s’agit ici de l’affichage du fameux Rich Snippet dans les résultats de recherche. Ces extraits enrichis, à l’aspect graphique plus propre et lisible sont plus attractifs visuellement. Les Rich Snippets génèrent par extension un taux de clic plus élevé et un volume de trafic plus important pour une position similaire.

2/ Les formats compatibles avec les extraits enrichis en 2015

Il existe plusieurs formats de balisage sémantique acceptés par Google dans le cadre des données structurée et de l’affichage de ses extraits enrichis :

Les microdonnées :

Apparues avec le HTML5, les microdonnées constituent le socle du projet Schema.org. Dans son principe, le balisage sémantique est assez simple. Il se constitue d’une série d’attributs parents et enfants, imbriqués afin de former des ensembles sémantiques cohérents.

Ces attributs sont assez faciles à reconnaitre, puisque qu’ils commencent tous par le terme « item » : itemscope, itemid, itemprop, itemref… Ces attributs sont ensuite disposés à l’intérieur des différentes balises HTML présentes dans le code de la page (div,img, ahref…), ce qui permet de conserver un rendu graphique identique.

Les microformats :

Technologie plus ancienne que les microdonnées, le microformat repose cependant sur le même principe d’ajout d’attributs au sein d’éléments HTML imbriquées (div, span, etc.). La syntaxe est ici différente et passe par l’utilisation d’attributs CSS de type CLASS (« h-card», «p-name», «u-url», «dt-published», «e-content »,etc.).

Le RDFa :

Comme son nom l’indique ((Resource Description Framework in Attributes) le format RDFa définit un cadre de travail définissant un ensemble d’attributs descriptifs des ressources utilisées… ce qui est pour ainsi dire une définition presque parfaite des données structurées !

Le format JSON :

Acronyme de Javascript Object Notation, le format JSON est reconnu nativement par Javascript et permet un transfert facilité de données. Popularisé de par son utilisation au sein des technologies web de type Ajax, il est à la fois facile à déployer et dispose d’une syntaxe relativement (!) simple à comprendre même pour un non-développeur (un référenceur ou un chef de projet emarketing par exemple).

3/ Schema.org, le « format de Google »

Si de nombreux formats sont désormais disponibles, je recommande pour l’affichage des Rich Snippets dans Google l’emploi du vocabulaire Schema.org associé au format Microdonnées, RDFa ou JSON.

La raison de mon choix est toute simple (enfantine ?), Google étant tout simplement l’un des partis à l’initiative de ce projet. Etant généralement sollicité en tant que consultant spécialiste de Google, cette raison me suffit 🙂
Sans être une technologie à part entière, le projet Schema.org constitue une convention entre les principaux moteurs de recherche concernant l’utilisation des données structurées. Géré conjointement par Google, Bing, Yahoo et Yandex, Schema.org propose un système de balisage de données structurées commun.

Organisation de la bibliothèque Schema.org

En pratique, le site www.schema.org présente de façon détaillé la méthode d’utilisation et d’intégration des différentes techniques de balisages. Pas de grande complexité ici donc, il suffit de suivre les instructions. La navigation sur le site est très simple, et les différents types de balises sont répertoriés par type de fonction du site internet traité, la nature de la ressource/ de l’élément traité :

  • création artistique et production intellectuelle (livre, film, recette de cuisine, série TV…)
  • fonctionnalités multimédia (vidéo, bande audio, image)
  • événementiel/ organisation d’un événement (concert, spectacle, soirée, représentation, etc.)
  • secteur médical, santé, pharmaceutique
  • personne morale/ organisation/ société
  • personne physique (auteur, rôle professionnel)
  • entreprise locale (hôtel, restaurant, café, bar…)
  • commerce/ activité commerciale
  • notation/ avis/ opinion/ commentaire, etc. (les fameuses petites étoiles dorées !)
  • action (description d’une action accomplie par une personne ou une organisation, par exemple le lancement d’un nouveau produit par une société)

Objectifs du projet pour les moteurs de recherche

Le but pour les moteurs de recherche est ici de permettre aux webmasters de rendre facilement leur site compatible avec l’utilisation de ces balises. Il s’agit donc d’en généraliser l’utilisation, notamment des microdonnées.
Du point de vue des acteurs du Search, l’enjeu est ici triple :

  • analyser plus facilement et rapidement le contenu d’une page web ; ceci permettrait à un moteur de recherche d’utiliser moins de ressources et donc d’économiser un peu d’argent au passage 🙂
  • comprendre de façon plus précise le contenu sémantique d’une page, et donc délivrer des résultats de recherche plus pertinents dans leurs SERPS ; l’information délivrée serait dès lors de meilleur qualité, et par extension l’utilisateur/ consommateur plus satisfait
  • déployer les rich snippets sur un maximum de recherche afin d’offrir une expérience utilisateur à l’internaute (cf. point précédent – happy customers make a healthy business )

4/ Rich snippet : checklist des principales fonctionnalités

Référencement local : organisation, entreprise, société

Description : nom de la voie (rue, avenue, boulevard, etc.), ville/ commune d’établissement, code postal, pays… auxquelles viennent s’ajouter les informations concernant l’organisation et l’auteur.

Utilisation possible : particulièrement adapté au référencement local de site vitrine.

Spécifications d’un produit/ eCommerce

Description : prix, marque, couleur, dimension, fabricant, modèle, poids, disponibilité en stock, notation, devise/ monnaie, description du produit, commentaire(s), note moyenne…

Utilisation possible : site ecommerce, boutique en ligne, vente sur internet

Fil d’ariane

Description : une fois balisé, le fil d’Ariane de votre site internet permet d’éviter les points de suspension affichés en cas d’URL longue interminable. Google la raccourcit alors en reprenant la structure visible de votre fil d’Ariane.

Utilisation possible : site vitrine, site corporate ou institutionnel, boutique en ligne/ ecommerce, etc. cette fonctionnalité apporte en fait un réel avantage à tout site dont l’arborescence dépasse une profondeur de premier niveau.

Etoiles dorées, notes et commentaires

Les étoiles dorées assorties du nombre de commentaires constituent un composant emblématique du Rich Snippet. Très souvent recherchées en priorité par le référenceur, elles permettent de mettre en avant :

  • les informations liées aux avis des internautes s’étant exprimés
  • la note moyenne
  • le nombre de commentaires disponible sur votre site internet

Communication corporate & blogging

Description : identité de l’auteur, date d’une publication, nature du contenu web… auquels s’ajoutent éventuellement les informations concernant l’auteur, l’organisation, les informations locales, le fil d’Ariane et les étoiles dorées.

5/ Données structurées et référencement local

Cet aspect est très bien expliqué dans la section concernée sur schema.org : http://schema.org/LocalBusiness
Dans le cadre du référencement local, les données structurées permettent d’indiquer des informations précieuses aux moteurs de recherche notamment :

  • l’organisation gérant le site
  • l’auteur
  • la géolocalisation/ le ciblage géographique

La définition des différents aspects de la localisation géographie est ici extrêmement importante dans une stratégie de SEO locale. Elle impacte conjointement sur les résultats servis dans Google Web et Google Maps. Qui plus est Le déploiement imminent dans le monde francophone (nous concernant la France et la Belgique) de l’algorithme Pigeon constitue un argument supplémentaire.

Sous ce nom de code officieux, cette mise à jour de l’algo de Google a entrainé plusieurs modifications majeures dans le référencement local. Le site Abondance.com (Olivier Andrieu) l’a synthétisé dans sa lettre recherche et référencement de janvier 2015.

Déployé dans tout le monde anglophone depuis la fin 2014, l’algorithme Pigeon entraine notamment :

  • une meilleure prise en compte du lieu depuis lequel l’utilisateur effectue la requête
  • la modification du rayon géographique des résultats affichés (variable en fonction du secteur d’activité)
  • la modification des paramètres déclenchant une recherche locale (affichage de la carte)
  • etc.

Etant donné les évolutions majeurs apportées à l’algorithme de Google en termes d’analyse sémantique du contenu web, il me semble évident que le déploiement de l’agorithme Pigeon renforcera l’importance du balisage sémantique. Il s’inscrit ainsi dans le prolongement d’autres évolutions, notamment :

  • l’algorithme Colibri (Hummingbird en anglais) déployé en 2013 repose déjà sur une analyse sémantique des recherches des internautes ; il permet notamment à Google dans le cas d’une recherche localisée de « catégoriser » chaque mot-clé de la recherche en fonction de leur signification ; par exemple le mot « bar » dans la requête « bar à salsa au sud de Bruxelles » fait référence à un lieu (et non pas à un poisson par exemple)
  • le passage de Google Adresse à Google Mybusiness (juillet 2014), entrainant une centralisation des informations concernant une même organisation (Association compte Google plus et Google Mybusiness)
  • Le perfectionnement constant de la recherche universelle depuis son lancement en 2007 : autrement dit la présence sur une même page de résultats de recherche issus de différentes plateformes de Google (Search, Maps, Youtube, Actualités, Vidéos…) ; l’amélioration de l’analyse sémantique permettant ici d’assurer une meilleure cohérence entre les différents résultats affichés
    – Le développement du Knowledge graph aux lieux géographiques : le knowledge graph (encart enrichi présent dans la colonne de gauche) présente des informations diverses dans le cas d’une recherche relative à un lieu telles que des images, les conditions météorologies, l’horaire actuel (fuseau) , la température, un encart Google Maps, etc.

6/ Intégration technique : mettre en place les balises

S’il peut s’avérer fastidieux et chronophage pour votre développeur web, en pratique le dispositif des données structurées est assez simple à mettre en place sur un site internet. Lors de mes missions de consultant SEO je recommande leur intégration dès que cela est possible.

Il s’agit purement et simplement d’attributs devant être disposés autour des éléments textuels, graphiques ou multimédia correspondants. Un système d’imbrication (nesting) de ces balises permet ensuite de définir un cadre sémantique (par exemple « itemscope » dans la syntaxe microdonnées Schema.org) en indiquant une thématique prédéfinie (itemtype) et au sein de ce cadre la nature de chaque élément (itemprop) concerné.

L’idée est ici de structurer chaque page web sous forme de « blocs sémantiques », c’est à dire d’ensembles porteurs de sens. Tout est ici très bien expliqué sur le site officiel www.schema.org .

7/ Outils de test d’affichage des rich snippets dans les SERPS

8/ Pour aller plus loin : liens utiles

Un commentaire ?