Parlons de vos projets, appelez nous

Indexation Google : Comment indexer un site sur google ?

Net Offensive

Mise à jour le

Temps de lecture : 7 minutes
5
(4)

Quel est le processus d’indexation d’un site web sur Google ?

Indexation sur le moteur de recherche Google

Qu’est-ce que l’indexation sur Google ? Combien de temps pour indexer un site sur Google ? Mon site est indexé sur Google, mais je n’ai pas de trafic ? Qu’est ce que Googlebot ? Voici quelques questions très souvent posées par nos clients SEO.

Pour mieux comprendre le fonctionnement du référencement naturel, il est important pour les webmasters de savoir comment fonctionnent les moteurs de recherche et quel est le processus est mis en place entre le moment où un contenu est mis en ligne et le moment où il s’affichera dans les résultats de Google.

Comment fonctionnent les moteurs de recherche ?

Fonctionnement des moteurs de recherche

Les moteurs de recherche fonctionnent en explorant des centaines de milliards de pages à l’ aide de leurs propres robots d’exploration du Web. Ces robots Web sont communément appelés robots de moteur de recherche ou araignées . Un moteur de recherche navigue EN LIGNE en téléchargeant des pages web et en suivant des liens sur ces pages pour découvrir les nouvelles pages mises à disposition.

Les moteurs de recherche ont trois fonctions principales :

Explorer : première étape du travail, parcourir Internet à la recherche de contenu, en parcourant le code et contenu pour chaque URL trouvée (pages des sites, images, vidéos, PDF…).

Indexation : le travail d’indexation consiste à stocker et organiser le contenu trouvé lors du processus d’analyse sur un serveur. Une fois qu’une page est dans l’index de Google, elle est disponible pour être affichée sur des requêtes pertinentes formulées par l’internaute.

Positionnement : Dernière étape, présenter dans les résultats de recherche les contenus qui répondent le mieux à la requête d’un internaute. Les résultats sont classés par ordre de pertinence selon une série de règles et algorithmes spécifiques à chaque moteur de recherche.

Quel est l’objectif de Google et de son moteur de recherche ?

L’objectif de Google est de fournir à ses utilisateurs les meilleurs résultats possible en termes de pertinence et de rapidité. Des centaines de milliards de pages sont stockées sur ses serveurs. Grâce à ses algorithmes actualisés plusieurs centaines de fois par an, Google tente de proposer les résultats les plus pertinents en fonction des intentions de recherche des internautes.

Afin de proposer des résultats optimums, il mettra de côté les contenus dupliqués, les contenus jugés sans intérêt, les sites qui abusent de techniques pour manipuler les résultats de recherche (spam).

Quel est le fonctionnement de Google en particulier ?

Exploration du web et GoogleBot

Indexation sur Google

Les araignées Google , également appelées «Googlebots», parcourent tout le Web, balayant chaque page Web (des milliards de documents) et explorant ses hyperliens afin de stocker ces données dans un ou plusieurs index.

Ce processus se poursuit jusqu’à ce que l’araignée (spider) du moteur de recherche ait trouvé, analysé et indexé pratiquement le maximum des pages visibles du web.

Le meilleur moyen pour Google de trouver et de revenir sur votre site consiste à détecter et à explorer les liens d’autres sites qui font des backlinks vers le vôtre.

Les moteurs de recherche voient et analysent chaque page du Web de manière indépendante. Un site Web est simplement une collection de pages Web liées entre elles, à l’aide de liens hypertextes .

La base d’internet et de son réseau de site est basée sur les liens et leur suivi.

L’indexation des contenus dans l’index de Google

Indexation des contenus dans l'index de Google

Une fois qu’une page Web a été explorée, Google analyse et stocke le code de ces pages dans d’énormes centres de données (index de Google), garantissant ainsi que les données peuvent être présentées rapidement aux internautes.

Google attribue un identifiant unique à chaque page Web et indexe le contenu de chaque page pour identifier précisément les éléments qui la composent.

Cette énorme base de données contient tous les contenus que Google à découvert et qu’il juge assez pertinents à proposer aux internautes..

Google gère un index supplémentaire, utilisé pour stocker les sites suspectés de spam, les sites avec un contenu en double et ceux qui sont difficiles à analyser (problèmes de taille ou erreurs de structure).

Classement dans les résultats Google

Le classement dans les résultats Google

L’algorithme du moteur de recherche a pour objectif de présenter un ensemble pertinent de résultats de recherche de haute qualité, qui répondent à la requête ou question de l’utilisateur, et ce le plus rapidement possible.

Lorsqu’une requête de recherche est entrée dans un moteur de recherche par un utilisateur, toutes les pages jugées pertinentes sont identifiées à partir de l’index et un algorithme est utilisé pour hiérarchiser les pages pertinentes en un ensemble de résultats classé dans un ordre défini.

Les algorithmes utilisés pour classer les résultats les plus pertinents sont différents pour chaque moteur de recherche. Une page qui se classe à un place précise pour une requête de recherche sur Google peut ne pas se classer de la même manière pour la même requête sur Bing .

Afin de pouvoir attribuer la pertinence et l’importance, les moteurs de recherche utilisent des algorithmes complexes conçus pour prendre en compte des centaines de signaux permettant de déterminer la pertinence et la popularité d’une page Web.

  • Pertinence : Identifier le contenu d’une page Web correspond à l’intention de recherche d’internaute (l’intention est ce que les chercheurs cherchent à accomplir avec cette recherche, ce qui n’est pas une mince affaire pour les moteurs de recherche – ou les SEO – à comprendre).
  • Popularité : la popularité et l’autorité d’un domaine sont déterminées par de nombreux facteurs, dont la qualité et quantité de liens entrants existants.

En plus de la requête de recherche, les moteurs de recherche utilisent d’autres données pertinentes pour renvoyer des résultats :

  • Lieu : Certaines requêtes de recherche dépendent du lieu et de la géolocalisation.
  • Langue détectée : Les moteurs de recherche renvoient les résultats dans la langue de l’utilisateur.
  • Historique de recherche précédent : Les moteurs de recherche renvoient des résultats différents pour une requête en fonction de l’historique de navigation de l’internaute.
  • Périphérique : Un ensemble de résultats différents peuvent être renvoyés en fonction du périphérique (pc, mobile, tablette) à partir duquel la requête a été effectuée.

Afin de transmettre les résultats à l’utilisateur final du moteur de recherche, ceux-ci doivent effectuer certaines étapes critiques :

  1. Interprétation de l’intention de la requête de l’utilisateur.
  2. Identification des pages Web dans l’index associé à la requête.
  3. Affichage du résultat et classement de ces pages Web par ordre de pertinence et de popularité

Le Crawl Budget

Crawl Budget

Google doit explorer des milliards de pages nouvelles et mises à jour. Afin de ne pas utiliser des ressources inutilement, il attribue à chaque site un budget de crawl qui déterminera le nombre de pages qu’il explorera chaque jour. En optimisant la priorité et son budget de crawl et en évitant à Googlebot d’explorer des pages inutiles, les ressources du moteur de recherche sont centralisées sur le contenu avec le plus d’importance d’un site web.

L’analyse de logs orientée pour le SEO permet de mieux comprendre le comportement et les erreurs rencontrées par le robot GoogleBot lorsqu’il explore le site sur le serveur.

Pourquoi une page peut ne pas être indexée par Google ?

Résultat pour une page non indéxée sur Google

Il existe un certain nombre de circonstances dans lesquelles une URL ou des parties du site ne seront pas indexées par un moteur de recherche :

  • Le robot.txt indique au moteur de recherche ce qui doit ou non être crawlé par ses robots d’exploration.
  • Des balises noindex demandent à ne pas indexer la page.
  • Une URL canonique est déjà définie pour une autre page.
  • Le contenu en ligne n’est pas considéré de qualité par les robots, duplicate content et plagiat, ou trop peu développé.
  • La page renvoyait un message d’erreur serveur au moment du passage du robot (erreurs 404).
  • La page est orpheline et ne peut pas être trouvée.
  • Le serveur est inaccessible.

Comment faire pour qu’un site web soit indexé par Google ?

Google peut indexer une nouvelle page de différente manière, en fonction de la méthode utilisée pour découvrir cette page.

Il existe de nombreuses façons de faire connaître une nouvelle page à Google :

  • Google Bot la découvre sur votre site via les liens internes.
  • La page est envoyée via un sitemap.
  • Une demande d’indexation est faite via l’outil pour webmasters Search Console.
  • Recevoir un lien depuis un autre site.

Combien de temps faut-il pour qu’un site soit indexé sur Google ?

Les délais d’indexation peuvent être très variables en fonction de la popularité de votre site, de la méthode de soumission de la nouvelle page au moteur de recherche, de la position de la page sur votre site (nombre de cliques depuis l’index), de la priorité de Google.

Le délai peut aller de 30 minutes à plusieurs jours. Pour autant, il ne faut pas confondre délais d’indexation avec le délai de positionnement qui lui est beaucoup plus long, dépendant de vos actions de référencement et non garanti.

Comment vérifier si un site internet est indexé dans Google ?

Indexation d'un site internet

Allez sur Google, puis recherchez via l’outil de recherche « site:votresite.com"

Le nombre affiché (ici 86) indique approximativement le nombre de pages du site indexées par Google.

Si vous souhaitez vérifier le statut d’une URL en particulier, utilisez cette recherche sur Google « site:votresite.com/nomdelapage"

Aucun résultat n’apparaîtra si la page n’est pas indexée.

Indexation d'une page

 

Comment supprimer une page de l’index de Google ?

Supprimer une page de Google

Une fonction de la Search Console permet de demander la suppression d’une page obsolète des résultats de Google.

Il suffit de se connecter sur cette page et d’entrer l’URL de la page supprimée du serveur à désindexer du moteur de recherche.

L’opération prendre en général entre 24 et 48h.

Si vous souhaitez un audit de votre site et des conseils afin d’améliorer le crawl, n’hésitez pas à nous contacter.

Avez vous aimé cet article ?

Cliquez sur les étoiles pour donner une note

Note moyenne 5 / 5. Nombre de votes : 4

Pas de votes pour le moment, soyez le premier à voter.