Fichier sitemap : définition et caractéristiques
Le fichier sitemap est un fichier au format XML reprenant la liste complète de toutes les URL de votre site web. Il permet ainsi aux robots des moteurs de recherche d’avoir accès direct à un document regroupant toutes les URL d’un site ce qui peut les aider à les parcourir et à les indexer.
Le fichier sitemap peut également fournir des métadonnées utiles pour les moteurs de recherche. Les métadonnées sont des informations sur une page Web, comme la date de sa dernière modification, sa fréquence de mise à jour ou son importance par rapport aux autres URL du site.
Le fichier sitemap peut également permettre de détailler certains contenus spécifiques comme les vidéos (durée de la vidéo, catégorie, public visé…) ou les images (contenu de l’image, auteur…), ou l’actualité.
La présence d’un fichier sitemap ne signifie pas que les robots des moteurs de recherche ne vont plus crawler votre site de manière naturelle mais ils pourront utiliser ce fichier pour analyser des pages profondes ou plus difficilement atteignables.
Quel emplacement pour le fichier sitemap ?
Afin d’être utilisé facilement par les robots des moteurs de recherche, le fichier sitemap.xml doit toujours être accessible relativement aisément.
Vous pouvez le placer à la racine de votre site de la manière suivante :
www.exemple.fr/sitemap.xml
Vous pouvez également, pour plus de clarté, créer plusieurs fichiers sitemaps en fonction des différents répertoires présents sur votre site :
www.exemple.com/sitemap-produit.xml
www.exemple.com/sitemap-categories.xml
www.exemple.com/sitemap-articles.xml
Vous pouvez enfin le déclarer en bas de votre fichier robots.txt (si vous en avez un) et il sera alors directement accessible aux robots car ils commencent toujours l’exploration d’un site web par ce fichier.
Quel format pour le fichier sitemap ?
Le format du fichier sitemap se compose de balises XML avec chaque URL des pages du site et les indications qui leurs sont attribuées comme le montre l’exemple ci-dessous :
<urlset xmlns=http://www.sitemaps.org/schemas/sitemap/0.9>
<url>
<loc>
<![CDATA[ https://www.exemple.fr/ ]]>
</loc>
<priority>1.0</priority>
<changefreq>daily</changefreq>
</url>
<url>
<loc>
<![CDATA[ https://www.exemple.fr/erreur-404 ]]>
</loc>
<priority>0.1</priority>
<changefreq>daily</changefreq>
</url>
Quelques règles d’écriture à respecter dans un fichier sitemap
- Les URL doivent être cohérentes et absolues (attention aux fautes de frappe)
- Le fichier sitemap doit être encodé en UTF-8
- Les URL doivent utiliser les caractères d’échappement proposés
- Les URL doivent être canoniques
- Les sites contenant un trop grand nombre de pages web doivent réaliser 2 fichiers sitemap
Les principales balises d’un fichier sitemap et leur signification
<urlset> : balise qui a pour but d’encadrer le fichier dans son ensemble.
<url> : balise parent qui permet à chaque URL d’intégrer le fichier
<loc> : correspond à l’URL à proprement parlé de la page
<lastmod> : correspond à la date de la dernière modification du fichier
<changefreq> : correspond à la fréquence de la modification que vous estimez pour la page. Plusieurs valeurs sont possibles (always, hourly, daily, weekly, monthly, yearly, never). Soyez dans la mesure du possible relativement précis. Il ne sert à rien d’indiquer hourly si la page en question n’est modifiée qu’une seule fois par an. Cela n’améliorera en aucun cas le positionnement de la page et peut vous desservir si les spiders considèrent cette pratique comme abusive.
Ne confondez pas exploration, indexation et positionnement
Comme il est dit plus haut, le fichier sitemap.XML permet de faciliter l’accès aux robots des moteurs de recherche à l’intégralité des pages de votre site web.
Mais ce n’est parce que les robots explorent vos pages qu’ils les indexeront ni encore moins qu’ils amélioreront leur positionnement.
En revanche, une page qui n’est pas explorée par un robot n’a quant à elle aucune chance d’apparaitre dans les pages de résultats de ce dernier ! C’est à ce niveau-là que le fichier prend toute son importance, et notamment pour les sites comprenant des milliers d’URL différentes.
Comment générer un fichier sitemap sur mon site ?
Il est très facile et très rapide de générer un fichier sitemap à partir de son site web. Même pour les débutants, de nombreux outils vous aident à créer un fichier sitemap à son bon emplacement afin qu’il soit visible des moteurs de recherche.
Parmi ces outils, il existe de nombreux générateurs de fichiers sitemap, comme par exemple Yoast SEO, plugin du CMS WordPress, qui une fois installé, vous génère automatiquement le fichier au format XML.
Comment informer Google de la création de mon fichier sitemap ?
Si vous avez ajouté une ligne confirmant la présence et l’adresse de destination de votre fichier sitemap à la fin de votre fichier robots.txt, Google et les autres moteurs de recherche y accèderont automatiquement (à condition que votre fichier robots.txt soit bien placé à la racine de votre site).
Voici la ligne à ajouter à la fin de votre fichier robots.txt pour aiguiller les moteurs de recherche vers l’adresse de votre sitemap:
Sitemap: http://www.mon-site-web.com/sitemap.xml
Vous pouvez également, si vous le désirez, soumettre votre fichier sitemap aux différents moteurs de recherche. Vous devez pour cela créer un compte et suivre les recommandations propres à chaque moteur de recherche.
Les limites du fichier sitemap ?
Le fichier sitemap aide-t-il au bon positionnement de mes pages web ?
Non, il ne vous aidera pas à mieux positionner vos pages web dans les pages de résultats des moteurs de recherche. Il permettra simplement (et ce n’est pas rien) à aider Google à les explorer et à les indexer.
Le fichier sitemap est-il indispensable pour mon site ?
Le fichier sitemap n’est absolument pas indispensable à tous les sites web présents sur la toile. Comme il est dit précédemment, ce fichier est utile pour aider Google ou les autres moteurs de recherche à explorer toutes les pages d’un site web et s’assurer qu’ils n’en ont pas oubliées. Or, si votre site ne contient que quelques pages (cas d’un site vitrine), et que le maillage interne est bien réalisé, les robots d’indexation n’auront aucun mal a explorer puis à indexer l’ensemble de vos pages.
Il est réellement utile voire indispensable pour les gros sites internet comprenant plusieurs centaines voire plusieurs milliers de pages qui ne sont pas toutes forcément bien reliées entre elles.
Il peut également être utile dans le cas d’un site web récemment mis en ligne et qui par conséquence ne possède pas ou peu de backlinks (liens externes entrants) ce qui limite l’exploration inter sites de la part des robots des moteurs de recherche.
Si vous souhaitez obtenir de plus amples informations, rendez-vous directement sur le site :