Crawlability (Capacidad de arrastre)

TL;DR
La rastreabilidad asegura un proceso sin problemas para que las arañas de los motores de búsqueda rastreen el sitio web con el fin de obtener información sobre el mismo e indexarlo.
¿Qué es Crawlability?
Crawlability representa la facilidad de los motores de búsqueda para rastrear un sitio web sin perder contenido esencial o tener su rastreador bloqueado. Los rastreadores o arañas representan los robots de los motores de búsqueda que rastrean un sitio web con el fin de recopilar información sobre su contenido y clasificarla adecuadamente.
¿Por qué es importante Crawlability para un sitio web?
Si el bot de un motor de búsqueda rastrea el sitio web correctamente y obtiene toda la información, el sitio web y sus páginas se indexarán correctamente.
Sin embargo, si hay enlaces rotos o una configuración incorrecta del mapa de sitio, puede conducir a algunos problemas de rastreabilidad, y la araña del motor de búsqueda no será capaz de acceder, rastrear e indexar contenido específico en un sitio.
Para asegurar un rastreo adecuado y sin problemas de un sitio, revise esta lista de acciones para evitar que las arañas se arrastren:
- Asegúrese de tener un archivo robots.txt correcto y de que la meta-etiqueta del robot en una página específica no bloquee el rastreador.
- Compruebe los códigos HTTP. Por ejemplo, el código de estado 200 indicará que la acción ha tenido éxito y que todo está bien.
- Verifique los campos del encabezado de respuesta HTTP que pueden tener un impacto en su estrategia de SEO: tales como x-robots tag (por ejemplo, X-Robots-Tag: noindex); servidor (por ejemplo, Server: nginx); ubicación (asegúrese de que las URLs a redirigir están funcionando), y enlace para mostrar que el recurso solicitado tiene una relación con otros recursos.
- Asegúrese de tener un archivo robots.txt correcto y de que la metaetiqueta del robot en una página específica no bloquee el rastreador.
- Comprueba los códigos HTTP. Por ejemplo, el código de estado 200 implicará que la acción ha tenido éxito y todo está bien.
- Verifique los campos del encabezado de respuesta HTTP que pueden tener un impacto en su estrategia de SEO: como la etiqueta x-robots (por ejemplo, X-Robots-Tag: noindex); servidor (por ejemplo, Server: nginx); ubicación (asegúrese de que las URLs a redirigir funcionan), y el enlace a muestra que el recurso solicitado tiene una relación con otros recursos.