Back to Question Center
0

Semalt: Comment Google sait quand (et pourquoi) arrêter d'explorer votre site Web?

1 answers:

Google araignées sont aussi importants que la campagne de référencement lui-même lors de la commercialisation d'un site Web. Ils explorent les sites Web et indexent le contenu de toutes les pages qu'il peut trouver. Il effectue également une réindexation sur les pages mises à jour sur le site. Il le fait régulièrement, en fonction de plusieurs facteurs. Ils incluent, sans s'y limiter, le PageRank, les contraintes d'exploration et les liens trouvés sur la page. Le nombre de fois que les robots Google explorent un site dépend d'un ou plusieurs de ces facteurs.

Un site Web devrait être facilement navigable par les visiteurs ainsi que les robots d'exploration de Google. C'est la raison pour laquelle avoir un site Web crawl-friendly est un avantage supplémentaire à sa campagne de référencement. Sinon, Google ne pourra pas accéder au contenu, réduisant ainsi le classement du site sur la page de classement du moteur de recherche .

Ross Barber, le Customer Success Manager de Semalt , définit que deux des facteurs d'indexation les plus importants sur lesquels Google s'appuie pour ralentir ou arrêter l'exploration de votre site sont le temps de connexion et HTTP code d'état. D'autres incluent la commande disavow, les balises "no-follow" et robots.txt.

Codes de temps de connexion et d'état HTTP

Le facteur de temps de connexion correspond à la durée nécessaire au robot d'exploration Google pour atteindre le serveur de site et les pages Web. La vitesse est grandement appréciée par Google, car elle est très révélatrice d'une bonne expérience utilisateur. Si la page Web n'est pas optimisée, le site sera mal classé. Les robots Google essaieront d'accéder au site Web et, si le temps nécessaire pour créer une connexion est plus long, ils reculeront et l'exploreront moins fréquemment. En outre, si Google tente d'indexer le site Web avec la vitesse actuelle, cela pourrait interrompre l'expérience utilisateur, car cela pourrait ralentir considérablement son serveur .

Le deuxième facteur d'indexation est le code d'état HTTP qui fait référence à la réponse du serveur à une requête d'exploration du site. Si les codes de statut se situent dans la plage 5xx, Google prend l'initiative d'arrêter ou de retarder la vitesse à laquelle ils explorent le site actuel. Tout ce qui se trouve dans la plage 5xx est un indicateur de problèmes possibles avec le serveur et la réponse à la demande peut être problématique. En raison du risque de causer des problèmes supplémentaires, les robots Google se retirent et effectuent l'indexation lorsque le serveur est plus accessible.

Quand Google reprend-il le site?

Google s'engage à fournir aux utilisateurs la meilleure expérience et à classer les sites qui optimisent leurs éléments SEO vers ces objectifs élevés. Cependant, si le site Web présente actuellement les problèmes mentionnés ci-dessus, il commandera à son Googlebot d'essayer de l'explorer plus tard. Si les problèmes persistent, le propriétaire perdra une bonne occasion d'avoir Google à travers son contenu et lui attribuer un rang bien mérité sur les résultats de recherche. En plus de ces problèmes, tout signe de spam empêchera le site d'apparaître dans les résultats de recherche.

Comme tous les autres algorithmes que Google utilise, ses araignées sont également automatiques. Ils sont développés pour trouver, analyser et indexer du contenu en fonction de certains paramètres. Si le site n'est pas conforme à certaines bonnes pratiques, l'indexation n'aura pas lieu. De nombreux autres facteurs entrent en ligne de compte, mais n'oubliez pas d'accorder une attention particulière à l'heure de connexion et aux codes d'état HTTP de votre site .

November 24, 2017
Semalt: Comment Google sait quand (et pourquoi) arrêter d'explorer votre site Web?
Reply