Temps de lecture : 6 minutes
4.3
(3)

Le guide du sitemaps en SEO : Définition, utilisation, création

Sitemaps et référencement : robots et fréquence d'exploration

Pour tous les non-initiés, le sitemap XML est un fichier recensant toutes les pages et urls (ou presque) d’un site web. Ce fichier peut être soumis aux moteurs de recherche afin de leur faciliter la tâche, tant au niveau du crawl, que de l’indexation.

Plus simplement, il s’agit de fournir une “carte“ de votre site à Google et aux autres moteurs. Libre à eux d’en suivre les indications, mais en règle générale, ces derniers apprécient ce genre d’attention, dans la mesure où elle leur permet d’économiser des ressources. Et comme on le sait, plus on facilite le travail d’un moteur, plus ce dernier est reconnaissant.

Attention, cette présentation simpliste ne reflète pas tout l’intérêt que peuvent représenter les sitemaps XML. Voici quelques conseils pour savoir comment ce fichier peut vous faciliter la vie et l’exploration des robots de crawl, tout en représentant une importance et une utilité certain en termes de référencement.

Qu’est-ce qu’un sitemap XML ?

Exemple de fichier XML
Quelques articles présents dans notre sitemap du blog

Il s’agit d’un protocole et d’un format qui permettent de lister toutes les urls d’un site web. Chaque url est rangée en fonction de sa position dans le site. Ainsi, au sein d’un même sitemap, on trouve une partie dédiée aux articles (posts) et une autre pour les pages. Il peut également recenser les vidéos, les photos, ainsi que d’autres types de fichier.

Lorsqu’on parle de sitemaps, on parle d’un protocole d’inclusion. En effet, il permet de soumettre des urls aux moteurs de recherche, qui les incluront (ou non) à leur index. Là où un robots.txt empêche un moteur de crawler des pages, un sitemap incite au contraire les robots de Google et des moteurs en général (spider) à crawler certaines urls.

La terminaison “XML“ signifie “ eXtensible Markup Language“, soit “langage de balise extensible“. Ce point signifie que comme d’autres protocoles, la forme que l’on en attend est normée.

Un balisage en code HTML est attendu dans ces fichiers :

  • La balise <loc> permet de préciser la localisation de la page.
  • La balise <lastmod> fait état de la date de la dernière mise à jour.
  • La balise <changefreq> précise la fréquence à laquelle la page subi une modification.
  • La balise <priority> permet de stipuler l’ordre de priorité d’une page à l’échelle de l’ensemble du contenu soumis.

Les adresses de sitemaps peuvent être intégrés dans le fichier robots du site qui est exploré par les moteurs de recherche.

Quel est l’intérêt SEO d’un sitemap XML ?

Outre le fait qu’il va faciliter le travail d’exploration des différents moteurs de recherche en ligne, il va pouvoir être utilisé en matière de SEO.

Le contenu d’un sitemap fait état du plan de votre site en ligne. Toutefois, peut-être est-il plus intéressant d’assurer la visibilité de chaque page possédant un intérêt SEO ou de conversion, plutôt que de laisser Google indexer de nombreuses urls moins utiles ou rentables ?

En considérant les choses sous cet angle, on va pouvoir s’atteler à la création d’une version de sitemap XML spécialement pensée pour optimiser l’indexation de ses pages d’importance. Pour ce faire, il suffira de générer un fichier ne faisant état que des liens vers les urls les plus importantes en termes de business ou de trafic. Les informations qu’il contient représentent ainsi l’essence de votre site.

Il suffit alors de se rendre dans la Google Search Console, puis d’y ajouter votre version de sitemap XML. Dès lors, Google est alerté et s’en servira certainement pour découvrir les liens des pages que vous lui avez soumises. De même que Google, Bing propose un“ Webmaster tool“ permettant de faire de même.

L’utilité de ne soumettre que les pages les plus importantes est évident. Les robots de crawl se déploieront en premier lieu sur les urls présentes dans les sitemaps. D’un point de vue SEO, c’est un atout, surtout s’il s’agit des pages les plus rentables ou les plus importantes. Leur indexation est très déterminante.

En SEO, lors d’un changement de nom de domaine ou de refonte et migration de site, le fichier sitemap permet d’indiquer les changements d’URL à Google.

Quel outil permet de générer un sitemap XML ?

Il existe plusieurs façons de créer des sitemaps.

Vous pouvez vous chargez de sa création à la main, via un éditeur XML, puis vous l’implémentez à votre site. Cette façon de faire peut s’avérer fastidieuse et chronophage. De plus, les moindres problèmes de balises peuvent entraîner des perturbations d’indexation de vos pages.

Il est possible de passer par la case développement. En ayant les compétences nécessaires pour réaliser ce type de manipulation, vous obtiendrez un fichier sur-mesure, répondant parfaitement à vos besoins. Attention toutefois, ce type de process peut s’avérer gourmand en ressource. A ne mettre en pratique que si vous avez le savoir-faire nécessaire.

Si ces méthodes vous effraient, il est possible d’avoir recours à des outils spécifiques, qui se chargeront de cette création. Vous pouvez soit passer par un site ou un programme de génération XML, soit utiliser un plugin capable de s’en charger.

Dans le cas de WordPress par exemple, des extensions et plugins SEO WP comme Yoast ou SEOpress vous permettront de vous acquitter de cette tâche simplement. En seulement quelques clics, votre sitemap XML sera créé et ajouté à votre site sur son serveur. Il ne vous restera plus qu’à le soumettre à Google par le biais de votre Search Console. C’est de loin la solution la plus simple et la plus rapide.

Il peut également être trouvé par les moteurs via un fichier robots hébergé sur votre serveur en fonction des URLS qui y sont indiquées.

A noter : Même en utilisant un plugin pour créer votre sitemap, rien ne vous interdit d’en supprimer les urls les moins importantes, celles étant en noindex, de même que les urls canoniques. Vous obtiendrez ainsi un fichier optimisé pour améliorer votre référencement naturel…

Pourquoi le sitemap permet-il d’optimiser son budget crawl ?

Si les sitemaps ont un véritable intérêt, c’est bien de permettre aux moteurs d’économiser leurs ressources. Google et les autres moteurs cherchent à réduire au maximum les tâches des robots, leur garantissant ainsi d’économiser leurs ressources.

Pour l’expliquer simplement, tous les sites se voient allouer un “budget crawl“, théoriquement en adéquation avec leur taille et leur architecture. Dès lors que les robots en charge de crawler les sites se retrouvent face à des impasses, des contenus anciens non mis à jour, ou encore face à des pages d’erreurs, ils ont tendance à stigmatiser le site concerné, pour finir par le crawler moins souvent.

Ce point peut s’avérer préjudiciable pour le référencement naturel de votre site. Il pourrait pâtir d’un déclassement au fil du temps.

Aussi, pour éviter de vous retrouver dans ce genre de situation, veillez à apporter une modification régulière à vos pages (autant que faire se peut), à soigner votre maillage interne et à corriger toutes les éventuelles erreurs de navigations présentes (erreurs 404, soft 404, etc.).

La création d’un sitemap XML permet de faire le point sur la structure de vos sites, de chaque page et de s’assurer que l’ensemble fonctionne correctement. Le crawl des bots n’en sera que facilité, permettant ainsi de s’assurer une bonne indexation générale. N’hésitez pas à mettre votre sitemap à jour régulièrement, surtout si vous avez l’habitude de publier des pages à un rythme irrégulier. Vous vous attirerez ainsi plus facilement les faveurs des moteurs de recherche.

L’analyse de logs dans un contexte SEO permettra de déterminer la fréquence de crawl de Google et d’identifier les erreurs rencontrées par les robots.

Comment créer des sitemaps efficaces ?

Tout d’abord, si vos sites compte de grandes quantités de pages, n’hésitez pas à fournir plusieurs fichiers à Google. Au-delà d’une certaine quantité de liens par sitemap, il ne les prend pas en compte.

Veillez également à fournir un sitemap différent par type de ressource. En créant un sitemap XML pour les contenus vidéo, un pour les contenus “image“, un pour les pages et un autre pour les articles, vous aurez la garantie que Google saisira précisément la structure de votre site. Même si les balises sont là pour stipuler la nature du contenu soumis, cela ne coûte pas grand-chose de prémâcher au maximum le travail des robots.

Enfin, n’hésitez pas à sortir de la liste les données qui ne vous semblent pas pertinentes ni primordiale. Le budget crawl sera économisé, et il y a de grandes chances pour que le moteur les découvre par le biais du maillage interne au fil du temps.

A noter : si vous possédez un tout petit site, il n’est pas primordial de créer un sitemap. En revanche, vous pouvez soumettre manuellement vos quelques urls dans la Google Search Console. Plutôt que d’attendre que votre site soit découvert par hasard au cours d’un crawl, n’hésitez pas à forcer l’indexation de vos pages. Bien évidemment, passée une certaine taille d’infrastructure, oubliez cette méthode et préférez un sitemap.

Conclusion : un sitemap XML peut être utile pour le référencement et l’indexation

Comme bien d’autres dispositifs, le sitemap doit être vu comme un outil mis à votre disposition pour faciliter le travail de Google et des moteurs en général.

Attention, ce n’est pas pour autant que les pages de vos sites se retrouveront à truster les premières positions des SERP ! Mais comme bien d’autres facteurs, un sitemap bien pensé et bien réalisé pourra avoir un effet bénéfique sur l’indexation et le référencement de vos pages.

Si votre site le requiert, pourquoi ne pas le doter d’un sitemap XML ? Si vous doutez quant à la nécessité d’en créer un, ou si vous craignez de ne pas savoir vous y prendre pour l’implémenter, contactez-nous. Nous étudierons ensemble les possibilités envisageables.

Avez vous aimé cet article ?

Cliquez sur les étoiles pour donner une note

Note moyenne 4.3 / 5. Nombre de votes : 3

Pas de votes pour le moment, soyez le premier à voter.