Bloqueado para indexación pero en sitemap.xml
Un archivo Sitemap.xml es esencialmente un mapa de tu sitio web diseñado específicamente para una fácil navegación e indexación de tu sitio por los motores de búsqueda. Se encuentra dentro de tu carpeta public_html (o raíz del sitio) e incluye instrucciones importantes para los rastreadores de motores de búsqueda que especifican qué páginas deben ser visitadas, en qué orden y con qué frecuencia deben ser visitadas.
Esto acelera drásticamente el proceso de indexación de páginas importantes y permite que los rastreadores de búsqueda asignen su tiempo de rastreo a páginas de alta importancia tanto para ti como para tus usuarios.
Crear un sitemap.xml no siempre es necesario, pero siempre es recomendable, especialmente para sitios grandes con miles de páginas. Con sitios más grandes, surge la necesidad de asegurarse de que los rastreadores de motores de búsqueda pasen su tiempo en esas páginas de alto valor con contenido profundo e intención comercial, no en páginas secundarias que ofrecen poco valor.
Como regla general, cuando el software y los CMS generan automáticamente un archivo sitemap.xml, incluyen todas las páginas disponibles para indexación. Es poco probable que un propietario de sitio web típico sea consciente de esto, y aunque haya configurado noindex para ciertas páginas, sus sitemaps generados automáticamente probablemente incluyan estas páginas y desperdicien valiosos presupuestos de rastreo.
Se recomienda encarecidamente usar plugins, software personalizado o generadores de sitemaps para configurar URL específicas que deben mostrarse en tu sitemap, ciertas URL que deben ser evitadas, en qué orden rastrear las URL y con qué frecuencia rastrearlas.
Errores de sitemap encontrados por Labrika
¡Atención! El informe de errores de sitemap solo será accesible si los permisos suficientes para escanear todo el sitio web están configurados correctamente. De lo contrario, Labrika solo podrá ver las páginas específicamente listadas en el sitemap.xml en lugar de poder ver todas las páginas del sitio web y luego compararlas con las páginas listadas en el sitemap.
El análisis de sitemap de Labrika ayuda a encontrar los siguientes tipos de errores:
- Páginas que existen en el sitemap pero no son accesibles para indexación.
- Páginas que existen en el sitemap pero tienen una etiqueta noindex.
- Páginas que no existen en el sitemap pero son indexables.
Por favor, tenga en cuenta: diferentes motores de búsqueda procesan las reglas de sitemap de diferentes maneras. Google, con mayor frecuencia, solo indexará las páginas que se pueden alcanzar a través del rastreo automático sin un sitemap. Es decir, páginas que se pueden alcanzar a través de enlaces internos dentro del tiempo de rastreo y la profundidad de rastreo asignados para tu sitio ese día. No mirarán tu archivo sitemap.xml para determinar qué enlaces rastrear, sino que usarán el sitemap como una guía para saber con qué frecuencia rastrear las páginas listadas en el sitemap.