Skip to main content

Noindex Tag

TL;DR

Un noindex représente une balise qui peut être placée sur une page d'un site web afin d'éviter sa visibilité dans les résultats des moteurs de recherche. Il est utilisé pour contrôler les pages indexées d'un site web et peut être facilement réalisé en plaçant un morceau de code sur la page, comme une balise meta ou un en-tête de réponse HTTP.

Qu'est-ce qu'une balise noindex ?

Un noindex représente une balise meta qui peut être facilement ajoutée sur un site web afin d'exclure des pages spécifiques de l'indexation par les moteurs de recherche.

Pourquoi un site web devrait-il utiliser une balise noindex ?

La balise noindex offre une flexibilité à tous les propriétaires de sites web en termes de type de contenu à afficher dans les moteurs de recherche, et pour contrôler l'accès à un site web page par page.

Une fois qu'une balise de non-indexation est ajoutée à une page spécifique, le moteur de recherche (par exemple, Googlebot) parcourt cette page et voit la balise ; il supprime complètement cette page des pages de résultats de recherche Google.

Quelles pages pourraient avoir un noindex sans affecter le classement du site ? Si la balise noindex n'est pas ajoutée à la bonne page (ou si elle est incorrectement ajoutée), des informations indésirables peuvent se retrouver dans les résultats (ou le site web entier peut se retrouver invisible dans le moteur de recherche, selon la manière dont il a été mis en œuvre). Voici donc quelques pages que l'on peut ne pas vouloir indexer :

  • Description des auteurs : si un site web ne compte qu'un seul auteur (ou plusieurs actifs), chaque fois qu'un article est publié, sa description peut également être ajoutée à la page, et elle peut être considérée comme un contenu dupliqué par les crawlers. L'option à retenir serait de ne pas indexer la page ou la description de l'auteur.
  • Pages personnalisées ou pages cachées : Si vous avez créé un contenu limité pour un public spécifique, vous pouvez le garder pour lui et ne pas le rendre visible dans les moteurs de recherche.
  • Pages de désabonnement ou de remerciement : ce sont des pages que les gens ne doivent atteindre qu'une seule fois, et leur contenu n'est ni précieux ni pertinent du point de vue du contenu. Certains sites web préfèrent ne pas indexer les pages d'inscription ou de désinscription également.
  • Résultats de recherche interne. Si un site possède une barre de recherche et que pour chaque requête, une page est générée et indexée, cela peut entraîner la perte de rang d'un site web. Un noindex peut donc être une bonne idée.

Comment mettre en œuvre un noindex ?

Il existe deux façons de mettre en œuvre un noindex : sous la forme d'une balise meta et d'un en-tête de réponse HTTP, en fonction de ce qui est le plus pratique pour un site web.

Pour éviter que la plupart des robots des moteurs de recherche n'indexent une page d'un site, veuillez placer la balise meta suivante dans la section <head> de la page : <meta name="robots" content="noindex">

Certains moteurs de recherche peuvent interpréter la directive de non-indexation différemment. Il est donc fortement recommandé de rechercher les recommandations de non-indexation de chaque moteur de recherche qui vous intéresse pour s'assurer que leurs pages n'apparaîtront pas dans les résultats de recherche.

Remarque importante : selon Google, pour que la balise noindex soit efficace, la page ne doit pas être bloquée par un fichier robots.txt car le crawler ne verra jamais la directive noindex, et la page peut toujours apparaître dans les résultats de recherche.