Votre site apparaît sur Google, mais certaines pages ne devraient pas y figurer ? Qu’il s’agisse de contenus dupliqués, de pages obsolètes, sensibles ou sans intérêt SEO, il est parfois nécessaire de demander à Google de les retirer de son index. La désindexation permet de maîtriser ce qui est réellement visible dans les résultats de recherche, déviter des pénalités, et d’optimiser la qualité perçue de votre site.
Positionnement et indexation : ne pas confondre les deux
En SEO, deux notions reviennent fréquemment : l’indexation et le positionnement. Bien qu’elles soient liées, elles désignent deux étapes différentes dans le processus de visibilité sur les moteurs de recherche.
L’indexation est le fait qu’une page web soit enregistrée dans l’index de Google. Une page indexée est potentiellement visible dans les résultats de recherche, même si elle ne génère aucun trafic. Sans indexation, aucune chance d’apparaître sur Google.
Le positionnement désigne la place qu’occupe une page dans les résultats de recherche pour un mot-clé donné. Une page peut être très bien positionnée en première position de Google ou très mal, en 5e page par exemple, mais cela n’est possible que si elle est déjà indexée.
Une page non indexée n’est pas référencée par Google. Elle est donc invisible dans les résultats. A l’inverse, une page mal positionnée est indexée par Google même si elle est difficilement trouvable par les internautes. Découvrez la différence en crawler, indexer et référencer.
Pourquoi désindexer un site ou une page de Google ?
La désindexation n’est pas une action à prendre à la légère. Il ne s’agit pas simplement de « supprimer » un contenu, mais de demander à Google de l’oublier volontairement. Dans certains cas, le contenu ou la page indexée par Google ne peut être supprimée car elle a une utilité pour l’annonceur, mais elle ne doit pas être trouvable sur Google. Voici les cas les plus courants où la désindexation est justifiée :
- Contenu dupliqué : pour éviter les pénalités SEO, il est parfois nécessaire de désindexer une version d’un contenu dupliqué (par exemple : une version imprimable, une page de test, une URL avec des paramètres).
- Pages sans valeur ajoutée : pages pauvres en contenu, peu utiles à l’utilisateur, générées automatiquement, ou obsolètes.
- Pages internes sensibles : pages administratives, tunnels de commande ou de connexion qui ne doivent pas être visible dans les SERP.
- Nettoyage d’un site en refonte : lors d’une refonte ou migration, certaines anciennes pages ne doivent plus être visibles. On préférera tout de même rediriger ces pages vers les nouvelles ou indiquer par le code HTTP adéquate qu’elles n’existent plus.
- Respect de la confidentialité ou du RGPD : pour retirer un contenu contenant des données personnelles ou des informations sensibles.
Comment désindexer un site ou une page de Google
Il existe plusieurs méthodes pour empêcher Google d’indexer une page ou pour demander la suppression d’un contenu déjà indexé.
Empêcher l’indexation
La balise Meta Robots
Pour les pages que vous ne souhaitez jamais indexer, il faut bloquer leur indexation en amont en ajoutant une balise meta robots dans le head :
<meta name= »robots » content= »noindex, nofollow »>
Cela indique aux moteurs de recherche de ne pas indexer la page et de ne pas suivres les liens qu’elle contient. Cette balise ne doit évidemment pas se trouver sur des pages stratégiques.
Le fichier robots.txt
Bien que moins fiable pour la désindexation, il permet d’empêcher Google de crawler certaines pages. Ce fichier se trouve à la racine du site sur le serveur et donne des indications de crawl aux moteurs de recherche.
User-agent: *
Disallow:/chemin-de-la-page/
Attention, une page bloquée dans le robots.txt mais déjà indexée ne sera pas désindexée automatiquement.
Demander la suppression d’une URL déjà indexée
Pour demander la suppression d’une page, il existe 3 solutions :
Utiliser la Google Search Console :
- Connectez-vous à la Search Console
- Allez dans Index > Suppressions
- Cliquez sur « Nouvelle demande » et entrez l’URL à désindexer
Google masquera cette URL temporairement (6 mois), mais il faudra en parallèle utiliser la balise noindex pour la désindexation devienne définitive.
Suppression du contenu
Le plus sûre est certainement, si c’est possible, de supprimer le contenu de votre site. Pensez néanmoins à afficher le bon code HTTP sur la page qui disparaît : 404 ou 410.
Vous pouvez aussi simplement passer votre contenu en noindex, mais Google ne la supprimera pas immédiatement, il faudra qu’il tente de crawler votre page pour découvrir ce changement, et selon la popularité de votre page, cela peut prendre du temps. Si vous souhaitez supprimer ainsi un contenu pour des raisons légales, il est probable que le contenu aura peu de popularité et il peut se passer quelques semaines avant de le voir disparaître.
Utilisation d’un en-tête HTTP X-Robots-Tag
Pour les fichiers et contenu non-HTML (PDF, images), utilisez dans la réponse HTTP :
X-Robots-Tag: noindex
Ce qu’il faut retenir sur la désindexation d’une page ou d’un site sur Google
L’indexation, c’est la présence dans l’index de Google. Le positionnement, c’est le rang d’apparition dans les résultats du moteur de recherche.
Désindexer, c’est faire disparaître une page ou un site des résultats de recherche.
La désindexation peut être utile pour nettoyer le SEO, éviter les doublons, ou respecter des obligations légales.
La méthode varie selon que la page est déjà indexée ou non, de son format, et selon le degré de contrôle que vous avez sur le site.