Vous avez mis en ligne votre site WordPress, tout semble fonctionnel, mais Google l’ignore totalement. Aucun résultat quand vous tapez `site:votredomaine.fr`. Cette situation, aussi frustrante soit-elle, touche des milliers de propriétaires de sites chaque année. Sans indexation, votre site reste invisible. Zéro trafic organique, zéro visibilité, zéro opportunité commerciale. C’est comme ouvrir une boutique dans une rue sans panneau ni adresse.
Cet article détaille les causes fréquentes de non-indexation, les méthodes de diagnostic via Google Search Console et les logs de crawl, puis une méthodologie concrète pour débloquer la situation. Vous trouverez aussi une checklist préventive pour éviter que le problème se reproduise. Le souci peut frapper un site flambant neuf comme un site existant après une migration ou une mise à jour malencontreuse.
Sommaire
Quelles sont les causes fréquentes de non-indexation d’un site WordPress ?
Plusieurs facteurs empêchent Google d’indexer un site WordPress. Certains sont ridiculement simples à corriger, d’autres demandent une investigation technique plus poussée.
Nous avons donc demandé conseils à L’agence Onze, experts en référencement WordPress, qui accompagne régulièrement des propriétaires de sites confrontés à ce type de blocage, et les causes reviennent presque toujours dans le même ordre.
Blocage par le fichier robots.txt ou la case « Demander aux moteurs de recherche de ne pas indexer ce site »
C’est la cause numéro un sur les sites WordPress récemment lancés. Dans Réglages > Lecture, une simple case cochée, « Décourager les moteurs de recherche d’indexer ce site », ajoute une directive noindex qui bloque tout. Lucio, co-fondateur de Onze, nous explique “Beaucoup de développeurs cochent cette option pendant la phase de développement. Puis ils oublient de la décocher à la mise en production. Résultat : le site reste fantôme pendant des semaines”.
Un fichier `robots.txt` mal configuré produit le même effet. Si votre fichier contient `Disallow: /`, vous demandez explicitement à Googlebot de ne rien explorer. Vérifiez-le en accédant à `votresite.fr/robots.txt` directement dans votre navigateur.
Balise meta noindex ajoutée par un plugin SEO ou le thème
Les plugins SEO comme Yoast, Rank Math ou SEOPress offrent un contrôle fin sur l’indexation. Le revers de la médaille ? Un mauvais réglage global peut appliquer un noindex sur l’ensemble du site.
Vérifiez deux niveaux : les réglages globaux du plugin (taxonomies, archives, pages auteur) et les réglages page par page. Certains thèmes WordPress ou plugins de maintenance ajoutent aussi un noindex automatique sans prévenir. La distinction entre un noindex global et un noindex sur des pages spécifiques change complètement l’approche de correction.
Erreurs techniques : erreurs serveur (5xx), redirections en boucle et problèmes d’accès (4xx)
Les erreurs 5xx empêchent Googlebot d’accéder à vos pages. Si le serveur plante à chaque tentative de crawl, Google finit par espacer ses visites, puis les abandonner. Les redirections mal configurées créent un autre piège. Une boucle 301/302 (page A redirige vers B, qui redirige vers A) bloque le crawl net. Les pages protégées par mot de passe renvoient des codes 403 ou 401 qui découragent aussi l’indexation.
Un certificat SSL expiré ou mal installé peut également bloquer Googlebot. Votre site affiche peut-être un avertissement de sécurité que les robots de Google refusent de franchir.
Manque de crawl : site trop récent, pas de backlinks ni de sitemap
Google découvre les nouvelles pages en suivant des liens. Si aucun site externe ne pointe vers le vôtre, Googlebot n’a tout simplement aucun chemin pour vous trouver. C’est le problème classique du site orphelin. L’absence de sitemap XML soumis à Google Search Console aggrave la situation. Le sitemap sert de carte routière pour les robots. Sans elle, ils naviguent à l’aveugle. Un contenu trop mince ou dupliqué décourage aussi l’indexation : Google explore la page mais décide qu’elle n’apporte pas assez de valeur pour figurer dans son index.
Comment diagnostiquer un problème d’indexation avec Google Search Console ?
Le rapport Pages (anciennement Couverture) dans Google Search Console constitue votre outil de diagnostic principal. Commencez par créer et vérifier votre propriété si ce n’est pas encore fait.
Dans ce rapport, chaque URL non indexée affiche un statut précis :
- Exclue par la balise noindex : une directive noindex bloque explicitement la page
- Détectée, actuellement non indexée : Google connaît l’URL mais ne l’a pas encore visitée
- Explorée, actuellement non indexée : Googlebot a visité la page mais refuse de l’indexer
- Erreur serveur (5xx) : le serveur a planté lors du crawl
- Page avec redirection : statut souvent normal, à vérifier au cas par cas
L’outil d’inspection d’URL permet de tester une page spécifique en temps réel. Collez l’URL, lancez le test en direct, et la GSC vous montre exactement ce que Googlebot voit : code HTTP, balises robots, canonical. Vérifiez aussi que votre sitemap XML apparaît dans la section Sitemaps, sans erreurs signalées. Le rapport Exploration complète le tableau en listant les erreurs de crawl rencontrées par Googlebot sur votre domaine.
Comment analyser les logs de crawl pour comprendre le comportement de Googlebot ?
Les logs serveur enregistrent chaque requête reçue par votre hébergement, y compris celles de Googlebot. Là où la GSC montre ce que Google veut bien vous dire, les logs révèlent la réalité brute du crawl. Accédez à vos logs depuis cPanel, Plesk ou le panneau de votre hébergeur (WP Engine, Kinsta, OVH). Cherchez un fichier nommé `access.log` ou similaire. Le volume de données peut être massif, d’où l’intérêt d’utiliser un outil d’analyse dédié.
Screaming Frog Log Analyser ou Oncrawl permettent de filtrer uniquement les requêtes de Googlebot. Vous identifiez alors trois informations capitales :
- Les pages que Googlebot ne visite jamais
- Les pages crawlées qui renvoient des erreurs
- La fréquence de passage du robot sur votre site
Croisez ces données avec celles de la GSC. Une page marquée « Détectée » dans la console mais absente des logs confirme que Googlebot n’a pas encore trouvé le chemin. Cette vision complète guide vos priorités de correction.
Méthodologie étape par étape pour débloquer l’indexation de votre site WordPress
Suivez ces étapes dans l’ordre. Chaque vérification élimine une cause potentielle et vous rapproche de la solution.
- Vérifier Réglages > Lecture dans WordPress. Décochez la case « Décourager les moteurs de recherche d’indexer ce site » si elle est active.
- Contrôler le robots.txt via `votresite.fr/robots.txt`. Supprimez tout `Disallow: /` qui bloquerait l’ensemble du site.
- Inspecter les balises meta robots dans le code source de vos pages (clic droit > Afficher le code source, cherchez « noindex »). Vérifiez aussi les réglages de votre plugin SEO.
- Générer et soumettre un sitemap XML valide dans la Google Search Console. Yoast et Rank Math le créent automatiquement.
- Corriger les erreurs techniques : résolvez les erreurs 5xx avec votre hébergeur, cassez les boucles de redirection, renouvelez le certificat SSL si nécessaire.
- Demander l’indexation manuellement via l’outil d’inspection d’URL pour vos pages prioritaires (accueil, pages de services, articles clés).
- Obtenir des backlinks de qualité vers votre site. Inscrivez-vous dans des annuaires pertinents, publiez un article invité, partagez sur vos réseaux.
- Patienter et surveiller. Google peut mettre quelques jours à plusieurs semaines pour indexer. Consultez la GSC régulièrement pour suivre l’évolution.
Checklist préventive pour éviter les problèmes d’indexation sur WordPress
Appliquez cette checklist à chaque mise en ligne et après chaque modification majeure (migration, changement de thème, mise à jour importante).
- ☑ Case « Décourager les moteurs de recherche » décochée avant toute mise en production
- ☑ Sitemap XML configuré et soumis dès le lancement du site
- ☑ Plugin SEO installé avec les réglages noindex vérifiés sur les taxonomies, archives et pages auteur
- ☑ Rapport Pages de la GSC consulté au moins une fois par semaine
- ☑ Alertes automatiques activées en cas d’erreurs de crawl (via GSC ou outils comme Ahrefs, SE Ranking)
- ☑ Fichier robots.txt et balises meta testés après chaque mise à jour de plugin ou de thème
- ☑ Site accessible en HTTPS sans erreurs de certificat
- ☑ Stratégie de backlinks active pour maintenir un crawl régulier
- ☑ Audit des logs serveur réalisé chaque trimestre pour vérifier la fréquence de passage de Googlebot
FAQ
Combien de temps faut-il à Google pour indexer un nouveau site WordPress ?
Comptez quelques jours à plusieurs semaines selon l’autorité de votre domaine. La soumission du sitemap et la demande d’indexation manuelle via la GSC accélèrent le processus. Un site sans aucun lien externe peut attendre plusieurs mois avant d’apparaître dans les résultats.
La commande site:mondomaine.fr n’affiche aucun résultat, que faire ?
Cette commande confirme que Google n’a indexé aucune page de votre site. Vérifiez immédiatement les réglages WordPress, le robots.txt et les balises noindex. Soumettez ensuite votre sitemap dans la GSC et demandez l’indexation de vos pages principales une par une.
Un plugin de maintenance peut-il empêcher l’indexation de mon site ?
Oui. Des plugins comme Coming Soon ou Maintenance Mode ajoutent souvent une balise noindex ou renvoient un code HTTP 503. Désactivez le mode maintenance dès que le site est prêt et vérifiez qu’aucune balise résiduelle ne persiste dans le code source.
Quelle différence entre « Détectée, actuellement non indexée » et « Explorée, actuellement non indexée » ?
« Détectée » signifie que Google connaît l’URL mais n’a pas encore envoyé Googlebot la visiter. « Explorée » signifie que le robot a visité la page mais a choisi de ne pas l’indexer, souvent par manque de qualité perçue ou de signaux d’autorité. Améliorer le contenu et obtenir des backlinks aide à débloquer les deux situations.
