Validador de Sitemap

Número de archivos de sitemap encontrados

Esto muestra cuántos archivos de sitemap se encontraron en el sitio. Los archivos de sitemap contienen una lista de páginas y otros recursos del sitio para ser indexados. Esta información ayuda a los motores de búsqueda a indexar el sitio de manera más eficiente.

El estándar adoptado para el sitemap permite el uso de muchos archivos de sitemap. Tenga en cuenta que los archivos de sitemap pueden no ser encontrados si sus rutas no cumplen con el estándar del protocolo de sitemap o tienen errores ortográficos.

Número de elementos en los archivos de sitemap

Este informe muestra el número de páginas HTML y otros recursos encontrados en todos los archivos de sitemap en el momento del análisis del sitio.

Número de páginas en todos los archivos de sitemap

Este informe muestra cuántas páginas en formato HTML se encontraron en todos los archivos de sitemap en el momento del análisis del sitio. Esto no incluye recursos en otros formatos como imágenes, etc.

Este es un informe útil para comparar el número encontrado en los archivos de sitemap vs el número real de páginas en el sitio e indexadas en los motores de búsqueda. Esto puede ayudar a detectar varios problemas rápidamente.

Por ejemplo, algunos sitios pueden no haber eliminado páginas del sitemap que han sido eliminadas o deshabilitadas en el panel administrativo del sitio. Esto puede llevar a una pérdida en el presupuesto de rastreo y potencialmente a una disminución en la posición del sitio. Si hay significativamente menos páginas en el índice del motor de búsqueda que en el sitemap, también puede indicar que el sitio tiene problemas con la indexación. O que el sitemap está formateado incorrectamente y contiene páginas adicionales.

Errores encontrados en el sitemap

Los errores en el sitemap pueden llevar a una interpretación incorrecta de los datos y a la imposibilidad de usar el archivo completo o líneas individuales dentro de él. Verificamos el sitemap para el cumplimiento con los estándares de sitemap, XML, w3c, así como las recomendaciones de Google, Yahoo, Bing y Yandex.

Advertencias encontradas en el sitemap

Las advertencias indican que hay problemas que disminuirán significativamente la efectividad de un sitemap.

Por ejemplo, si un sitio tiene decenas de miles de páginas, si se hace correctamente, los cambios de indexación en las páginas pueden tardar varias horas a varios días. Sin embargo, si se hace incorrectamente, por ejemplo, si no hay marcas de tiempo en el sitemap, entonces puede tomar varias semanas indexar los cambios. Esto, por lo tanto, ralentiza cualquier promoción u optimización de su sitio.

Mensajes de error

URL inválida en el archivo de índice del sitemap

Esto significa que la URL del archivo de sitemap está formateada incorrectamente o contiene caracteres inválidos. Hay varias razones comunes por las que este error puede ocurrir:

URL inválida

La URL en su sitemap no está escrita correctamente. Este error puede deberse a que contiene espacios, caracteres no soportados o inválidos.

Por ejemplo, htp:// o http:/ en lugar de http://

Asegúrese de que las URLs listadas en el sitemap estén adecuadamente protegidas.

Por ejemplo, el carácter "&" en la URL debe ser reemplazado por "%26" y todos los espacios por "%20".

Las URLs en el sitemap deben cumplir con el estándar RFC-3986

(https://www.ietf.org/rfc/rfc3986.txt)

El estándar XML (https://www.w3.org/TR/REC-xml/)

Y el estándar RFC-3987 (https://www.ietf.org/rfc/rfc3987.txt).

Para más detalles:

https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2

Sitemap vacío

El archivo de sitemap no contiene ninguna URL

URLs no accesibles

Este error aparece cuando no podemos recuperar las URLs en el sitemap.

Verifique la URL del sitemap usando la herramienta de verificación de URL: (https://support.google.com/webmasters/answer/9012289) para averiguar si esta dirección está disponible para Google.

Error de compresión

Obtuvimos un error al intentar descomprimir el archivo. Use el formato gzip para comprimir el archivo.

Demasiadas redirecciones (>4)

La URL contiene demasiadas redirecciones para los robots de búsqueda. Reemplace las direcciones de redirección en sus archivos de sitemap con las URLs que necesitan ser escaneadas. Evite usar redirecciones de tipo JavaScript o meta-actualización.

Sin declaración de formato

Este error ocurre si el sitemap tiene un título incorrecto o falta el título para el formato.

Por ejemplo, si su sitemap está creado en formato XML, entonces debe tener el título:

<?xml version="1.0" encoding="UTF-8"?>

Además, según las reglas de Google y los estándares aceptados, todos los atributos XML deben estar entre comillas simples (') o dobles ("). Las comillas deben ser rectas, no curvas.

Tenga en cuenta que los programas de procesamiento de texto, como Microsoft Word, pueden reemplazar las comillas rectas con curvas y esto violaría los requisitos.

Para más detalles, visite:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Error de tamaño del archivo de sitemap

El tamaño de su sitemap en su forma no comprimida excede los 50 MB. Si su sitemap es más grande que el límite, debe dividirse en varios archivos más pequeños.

Para más detalles, visite:

https://developers.google.com/search/docs/advanced/sitemaps/large-sitemaps

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Demasiadas URLs en el sitemap

Su sitemap contiene más del máximo de 50,000 URLs. Divida el sitemap en varios archivos y asegúrese de que cada uno contenga no más de 50,000 URLs. También puede usar el archivo de índice del sitemap para colocar las URLs en sus sitemaps.

Para más detalles, visite:

https://developers.google.com/search/docs/advanced/sitemaps/large-sitemaps

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Demasiados sitemaps en el archivo de índice del sitemap

El archivo de índice del sitemap contiene más de 50,000 sitemaps.

Divida el archivo de índice del sitemap en varios archivos y asegúrese de que no se especifiquen más de 50,000 sitemaps en cada uno de ellos.

Para más detalles, visite:

https://developers.google.com/search/docs/advanced/sitemaps/large-sitemaps

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#index

Fecha inválida

Su sitemap contiene un formato de fecha inválido.

Las fechas deben usar la codificación W3C Datetime (https://www.w3.org/TR/NOTE-datetime).

Ejemplo de formatos aceptables:

El tiempo es opcional (el tiempo predeterminado es 00:00:00Z).

Sin embargo, si especifica el tiempo, debe especificar la zona horaria.

Para más detalles, visite:

https://www.sitemaps.org/protocol.html#xmlTagDefinitions

https://www.w3.org/TR/NOTE-datetime

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

XML inválido: demasiadas etiquetas

El sitemap contiene etiquetas duplicadas.

Ejemplo de error:

<url> <loc>http://www.example.com/</loc> <lastmod>2021-12-17</lastmod> <lastmod>2021-12-19T16:00:17+04 00</lastmod> <priority>0.8</priority> </url>

En el ejemplo, la etiqueta <lastmod> se especifica dos veces para un elemento - esto es un error.

El número de línea se especificará en el mensaje de error. Para resolverlo, simplemente elimine la etiqueta duplicada.

Documentación: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

URL a otro dominio

El sitemap no puede contener una URL a otro nivel de dominio o subdominio.

Por ejemplo, en el sitemap https://example.com/sitemap.xml no puede referirse a https://en.example.com/index.htm ya que este es un dominio diferente.

Para más detalles, visite

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#location

Valor de atributo inválido

El atributo contiene un valor inválido para la etiqueta XML. Verifique sus sitemaps y asegúrese de que solo contengan atributos permitidos y que estén escritos según las especificaciones del sitemap. También verifique los atributos y valores por errores tipográficos.

Para más detalles, visite:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Formato no soportado

Google soporta los siguientes formatos de archivo:

Este error también ocurre si el sitemap tiene un título incorrecto o falta el título para el formato utilizado.

Por ejemplo, si su sitemap está en formato XML, entonces debe tener el título:

<?xml version="1.0" encoding="UTF-8"?>

Como se mencionó anteriormente, según las reglas de Google, todos los atributos XML deben estar entre comillas simples (') o dobles ("). Las comillas deben ser rectas, no curvas.

Tenga en cuenta que los programas de procesamiento de texto, como Microsoft Word, pueden reemplazar las comillas rectas con curvas. Esto va en contra de los requisitos estándar.

Fuente: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Incompatibilidad de ruta - Falta www

La ruta al sitemap no contiene el prefijo www (por ejemplo, https://example.com/sitemap.xml)

Pero las URLs listadas en él contienen www (por ejemplo, https://www.example.com/index.hml).

Todas las páginas del sitio deben redirigirse a la versión deseada - con www o sin www. Asegúrese de que el sitemap contenga la misma variante de prefijo.

Fuente: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Incompatibilidad de ruta: Incluye www

La ruta al sitemap contiene el prefijo www (por ejemplo, https://www.example.com/sitemap.xml), pero las URLs listadas en él no contienen www (por ejemplo, https://example.com/index.hml).

Todas las páginas del sitio deben redirigirse a la versión deseada - con www o sin www. Asegúrese de que el sitemap contenga la misma variante de prefijo.

Fuente: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Nombre de espacio incorrecto

El sitemap no contiene el namespace correcto o está declarado incorrectamente. El namespace puede tener un error tipográfico o una URL incorrecta.

Asegúrese de estar usando el namespace correcto para su tipo de archivo. Por ejemplo:

Un archivo que almacena HTML e imágenes contendrá

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">

El error puede ocurrir si el formato está escrito incorrectamente, por ejemplo: /.9 en lugar de /0.9.

O si la ruta está especificada incorrectamente, por ejemplo:

<urlset xmlns="/schemas/sitemap/0.9">

en lugar de

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
o <urlset xmlns="http://www.sitemaps.org/schmas/sitemap/0.9">

- aquí falta la letra en el enlace.

Fuentes: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.w3.org/XML/Schema#dev

Valor de etiqueta inválido

Su sitemap contiene una etiqueta con un valor inválido. Verifique las especificaciones para su tipo de sitemap.

Para más detalles, visite:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#xmlTagDefinitions

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

https://developers.google.com/search/docs/advanced/sitemaps/image-sitemaps

https://developers.google.com/search/docs/advanced/sitemaps/news-sitemap

URL inválida en el archivo de índice del sitemap: URL incompleta

Google describe este error de la siguiente manera: "El archivo de índice del sitemap contiene una URL incompleta".

Cuando los motores de búsqueda ven el índice del sitemap, buscan en el mismo directorio los archivos a los que enlaza.

La ubicación del archivo Sitemap define un conjunto de URLs que pueden ser incluidas en ese archivo Sitemap en particular.

Por ejemplo, un archivo Sitemap ubicado en http://example.com/catalog/sitemap.xml puede incluir cualquier URL que comience con http://example.com/catalog/

Pero no puede incluir URLs que comiencen con http://example.com/images/.

Si nuestra herramienta no puede encontrar la URL allí, verá este error. Actualice el archivo de índice del sitemap para incluir la ruta completa a cada archivo de sitemap en la lista, y luego vuelva a enviarlo.

Ha habido muchos casos judiciales contra motores de búsqueda por la indexación errónea de secciones de sitios que están cerradas

Aunque hay poca información sobre este error, se le dedica una sección completa en los estándares de sitemap de Google, a pesar de que muchos otros errores no están incluidos. Por lo tanto, en nuestra opinión, esta regla existe para evitar la indexación errónea de datos que se supone deben estar bloqueados para la indexación.

Tenga en cuenta que no todos los desarrolladores toman nota de estos estándares de sitemap al desarrollar sus plugins CMS, y por lo tanto este error puede surgir.

Fuentes: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#location

Falta atributo requerido en XML

No hay un atributo en la etiqueta del sitemap. Esto es requerido.

Ejemplo de error:

<?xml version="1.0" encoding="UTF-8"?>
<urlset>
<url>
<loc>http://www.example.com/</loc>
<lastmod>2023-11-09</lastmod>
</url>
</urlset>

Aquí en la etiqueta

<urlset>

Este atributo se omite:

xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

La etiqueta debe incluir:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

Fuente: https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap

Falta etiqueta XML requerida

Falta la etiqueta requerida. El número de línea se especificará en el mensaje de error.

Ejemplo de error:

<url>
<lastmod>2021-12-19T16:00:17+04 00</lastmod>
<priority>0.8</priority>
</url>

Falta la etiqueta <loc> en el ejemplo, por lo tanto, no está claro a qué URL pertenece el elemento.

Para más detalles, visite:

https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap

https://www.sitemaps.org/protocol.html

Falta URL de miniatura

Falta la URL de la imagen en miniatura.

Asegúrese de que la ubicación de las URLs de todas las miniaturas esté especificada usando la etiqueta <video: thumbnail_loc>.

Fuente: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

Falta título del vídeo

Falta de título para el video.

Asegúrese de que cada video tenga un título especificado en la etiqueta <video: title> en su sitemap.

Fuente: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

Formato incorrecto del índice del sitemap: Índices de sitemap anidados

Una o más entradas en su archivo de índice del sitemap apuntan a su propia URL o a la URL de otro archivo de índice del sitemap.

No se pueden especificar otros archivos de índice del sitemap en el archivo de índice del sitemap, solo archivos de sitemap.

Elimine todas las entradas que apunten a archivos de índice del sitemap.

Fuente: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Error de análisis

No pudimos analizar el XML del sitemap. Lo más probable es que el archivo tenga violaciones en su formato XML. Necesita descargar el archivo y verificarlo con uno de los validadores XML.

A menudo, este problema es causado por un carácter no protegido en la etiqueta URL que viola el anidamiento. Como con todos los archivos XML, cualquier valor de datos (incluyendo URLs) debe usar códigos de escape de entidad para ciertos caracteres, como caracteres & '"<>.

Asegúrese de que sus URLs estén correctamente escapadas. Por ejemplo, el carácter "&" debe ser reemplazado en la URL con "%26", y todos los espacios con "%20".

Las URLs en el sitemap deben cumplir con:

Fuente: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Miniatura demasiado grande

La imagen en miniatura del video especificado en el sitemap es demasiado grande. Reduzca el tamaño de la miniatura del video a 160 x 120 píxeles.

Fuente: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Para más detalles, visite:

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps?visit_id=637740801105480409-2568149602&rd=1

Miniatura demasiado pequeña

La imagen en miniatura del video especificado en el sitemap es demasiado pequeña. Aumente el tamaño de la miniatura del video a 160 x 120 píxeles.

Fuente: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Para más detalles, visite: https://developers.google.com/search

Ubicación del video y ubicación de la página de reproducción son las mismas

En el mapa del sitio de videos, la URL del contenido del video y la URL del reproductor no pueden coincidir. Si especificas tanto <video: player_loc> como <video: content_loc>, las URLs deben ser diferentes.

Para más detalles visita:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

La URL de ubicación del video parece ser una URL de página de reproducción

La URL del contenido del video <video: content_loc> apunta a la misma página donde se encuentra el reproductor.

Para más detalles visita:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

Etiqueta <changefreq> = never

La etiqueta <changefreq> en el mapa del sitio indica al motor de búsqueda con qué frecuencia debe volver a escanear esta página. Los escáneres pueden rastrear periódicamente páginas marcadas como "never" para rastrear cambios inesperados en estas páginas. Sin embargo, este valor de 'never' no se recomienda porque si cambias repentinamente el contenido de la página y pones una fecha nueva en la etiqueta <lastmod>, no está claro cómo se comportará el motor de búsqueda y si los cambios se indexarán y cuánto tiempo podría tomar.

El mapa del sitio está bloqueado por robots.txt

Los motores de búsqueda no podrán acceder a tu mapa del sitio porque el archivo robots.txt lo bloquea.

Cambia el archivo robots.txt para permitir que los robots escaneen el mapa del sitio.

Enlace relativo

En los estándares de sitemaps.org se registran los siguientes requisitos:

URL de la página. Esta URL debe comenzar con el protocolo (como HTTP) y terminar con una barra diagonal si tu servidor web lo requiere. Este valor debe ser menor de 2,048 caracteres.

Fuente: https://www.sitemaps.org/protocol.html#xmlTagDefinitions

URL demasiado larga

La longitud de la URL no puede exceder los 2048 caracteres.

Fuente: https://www.sitemaps.org/protocol.html#xmlTagDefinitions

Tipos de advertencias:

Todas las páginas dentro del mismo mapa del sitio tienen el mismo tiempo de modificación del documento

Para que los motores de búsqueda funcionen de manera efectiva, el mapa del sitio debe contener la fecha real del cambio de la página. Sin esto, pierde dramáticamente su efectividad.

Para entender este problema, necesitas saber cómo funcionan los motores de búsqueda. El motor de búsqueda gasta recursos leyendo y analizando cada página, aumentando la carga en el servidor donde está alojado el sitio. Por lo tanto, el motor de búsqueda calcula un llamado presupuesto de rastreo para cada sitio. En su forma simplificada, esto significa cuántas páginas deben ser indexadas en un sitio particular por día.

Ejemplo: Un sitio tiene 10,000 páginas y un presupuesto de rastreo de 300 páginas por día. Pero por un corto tiempo, el motor de búsqueda puede aumentar este presupuesto, por ejemplo, hasta 900 páginas por día, si nota que todas las páginas del sitio han cambiado, o si has enviado el mapa del sitio para reindexar.

Si no hay un mapa del sitio, entonces en modo normal, el presupuesto se asignará para indexar tres categorías de páginas:

Entonces, para un sitio con 10,000 páginas (sin un mapa del sitio), y con una tasa de 300 páginas siendo indexadas por día, podría tomar más de 34 días ser indexado en su totalidad. Esto se debe a que parte del presupuesto de rastreo se gastará en reindexar páginas ya completadas. Por lo tanto, desperdiciando presupuesto de rastreo y tiempo.

El motor de búsqueda solo tiene dos formas de saber si una página ha cambiado: leyendo la información sobre la página en el mapa del sitio (sin gastar el presupuesto de rastreo) o indexando la página (y gastando el presupuesto de rastreo en ella). Por lo tanto, si no tienes una etiqueta con la fecha correcta de actualización de la página, simplemente reindexará todas las páginas.

Al tener el mismo tiempo de modificación del documento para todas las páginas en un mapa del sitio, los motores de búsqueda no saben qué páginas priorizar. Pueden centrarse en otros elementos como la etiqueta de prioridad. Sin embargo, esta es una herramienta mucho menos precisa para acelerar la indexación. Por ejemplo, puedes tener 1000 páginas con una prioridad de 0.8 y 9000 páginas con una prioridad de 0.3. En este caso, los cambios en las páginas del primer grupo pueden ser indexados en más de cinco días, y del segundo grupo, podría ser más de un mes. Si usas esta etiqueta de prioridad junto con la fecha de modificación del documento correctamente, los cambios de indexación pueden ocurrir dentro de un día.

El tiempo de cambio de la página debe especificarse en el formato W3C Datetime (http://www.w3.org/TR/NOTE-datetime).

El estándar permite varios formatos, por ejemplo:

<lastmod>2021-12-23T18:00:15+00:00</lastmod>

o

<lastmod>2021-11-23</lastmod>.

El mapa del sitio no contiene una etiqueta con la última fecha de modificación del documento

Para que los motores de búsqueda funcionen de manera efectiva, el mapa del sitio debe contener la fecha real del cambio de la página. Sin esto, pierde dramáticamente su efectividad y se vuelve inútil.

Para entender este problema, necesitas saber cómo funcionan los motores de búsqueda. El motor de búsqueda gasta recursos leyendo y analizando cada página, aumentando la carga en el servidor donde está alojado el sitio. Por lo tanto, el motor de búsqueda calcula un llamado presupuesto de rastreo para cada sitio. En su forma simplificada, esto significa cuántas páginas deben ser indexadas en un sitio particular por día.

Ejemplo: Un sitio tiene 10,000 páginas y un presupuesto de rastreo de 300 páginas por día. Pero por un corto tiempo, el motor de búsqueda puede aumentar este presupuesto, por ejemplo, hasta 900 páginas por día, si nota que todas las páginas del sitio han cambiado, o si has enviado el mapa del sitio para reindexar.

Si no hay un mapa del sitio, entonces en modo normal, el presupuesto se asignará para indexar tres categorías de páginas:

Entonces, para un sitio con 10,000 páginas (sin un mapa del sitio), y con una tasa de 300 páginas siendo indexadas por día, podría tomar más de 34 días ser indexado en su totalidad. Esto se debe a que parte del presupuesto de rastreo se gastará en reindexar páginas ya completadas. Por lo tanto, desperdiciando presupuesto de rastreo y tiempo.

El motor de búsqueda solo tiene dos formas de saber si una página ha cambiado: leyendo la información sobre la página en el mapa del sitio (sin gastar el presupuesto de rastreo) o indexando la página (y gastando el presupuesto de rastreo en ella). Por lo tanto, si no tienes una etiqueta con la fecha correcta de actualización de la página, simplemente reindexará todas las páginas.

El tiempo de cambio de la página debe especificarse en el formato W3C Datetime (http://www.w3.org/TR/NOTE-datetime)

El estándar permite varios formatos, por ejemplo:

<lastmod>2021-12-23T18:00:15+00:00</lastmod>

o

<lastmod>2021-11-23</lastmod>.

Cabe señalar que no todos los formatos de archivo de mapa del sitio permiten la fecha de última modificación o la etiqueta de prioridad. Si tu sitio no admite este formato de mapa del sitio, esto puede perjudicar la velocidad de indexación de tu sitio. Puede valer la pena considerar cambiar de plataforma si este es el caso.

No hay fecha de actualización de la página ni prioridad de actualización de la página en todo el mapa del sitio

La fecha de actualización de la página y la prioridad de indexación de la página son los dos atributos más importantes del mapa del sitio. La etiqueta que contiene la última hora de modificación permite a los motores de búsqueda determinar qué páginas han cambiado hoy y deben ser indexadas lo más rápido posible si hay suficiente presupuesto de rastreo. Este es el mejor atributo para acelerar la indexación.

El atributo de prioridad te permite indexar primero las páginas más importantes, incluso entre estas páginas actualizadas. Sin embargo, si el mapa del sitio no especifica ni la prioridad ni la última hora de modificación del documento, el sitio tendrá grandes problemas cuando se trate de indexación.

Los motores de búsqueda gastan recursos leyendo y analizando cada página, por lo tanto, aumentando la carga en el servidor donde está alojado el sitio. Por esta razón, el motor de búsqueda calcula un llamado presupuesto de rastreo para cada sitio. Esto es esencialmente, cuántas páginas deben ser indexadas en un sitio particular por día.

Ejemplo: Un sitio tiene 10,000 páginas y un presupuesto de rastreo de 300 páginas por día. Pero por un corto tiempo, el motor de búsqueda puede aumentar este presupuesto, por ejemplo, hasta 900 páginas por día, si nota que todas las páginas del sitio han cambiado, o si has enviado el mapa del sitio para reindexar.

Si no hay un mapa del sitio, entonces en modo normal, el presupuesto se asignará para indexar tres categorías de páginas:

Entonces, para un sitio con 10,000 páginas (sin un mapa del sitio), y con una tasa de 300 páginas siendo indexadas por día, podría tomar más de 34 días ser indexado en su totalidad. Esto se debe a que parte del presupuesto de rastreo se gastará en reindexar páginas ya completadas. Por lo tanto, desperdiciando presupuesto de rastreo y tiempo. Sin embargo, si usas las etiquetas <lastmod> y <priority> correctamente, entonces puedes ver páginas indexadas dentro de un día.

El tiempo de cambio de la página debe especificarse en el formato W3C Datetime (http://www.w3.org/TR/NOTE-datetime ). El estándar permite varios formatos, por ejemplo:

<lastmod>2021-12-23T18:00:15+00:00</lastmod>

o

 

<lastmod>2021-11-23</lastmod>.

Cabe señalar que no todos los formatos de archivo de mapa del sitio permiten la fecha de última modificación o la etiqueta de prioridad. Si tu sitio no admite este formato de mapa del sitio, esto puede perjudicar la velocidad de indexación de tu sitio. Puede valer la pena considerar cambiar de plataforma si este es el caso.

No hay tasa de actualización ni prioridad de indexación especificada para la página.

Para ser indexado lo más rápido posible, es mejor:

Sin estos datos, un motor de búsqueda en un sitio grande puede no indexar los cambios en la página durante más de un mes. Las páginas sin información de prioridad, pero con actualizaciones frecuentes, se indexarán según los estándares básicos de indexación, aumentando considerablemente el tiempo para indexar páginas potencialmente importantes.

Espacio en blanco inicial

Tu mapa del sitio comienza con un espacio, no con una declaración de espacio de nombres. Los archivos XML deben comenzar con una declaración XML que especifique la versión de este formato a utilizar.

Esto no impedirá que los motores de búsqueda procesen tu mapa del sitio, pero Google recomienda eliminar los espacios para que el archivo cumpla con el estándar XML.

Fuente: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

La URL del mapa del sitio redirige a otra URL

Por ejemplo, especifica http://example.com/sitemap.xml, pero redirige a https://example.com/sitemap1.xml.

Esto no impedirá que los motores de búsqueda procesen tu mapa del sitio, pero puede causar problemas si la redirección no funciona correctamente.

Reemplaza las URLs de redirección en tus archivos de mapa del sitio con aquellas que necesitan ser escaneadas.

Formato de prioridad de URL no válido

La prioridad de indexación puede tener un valor de 0.0 a 1.0.

Un punto separa los dígitos en el valor, y los valores menores que uno deben comenzar con el carácter "0". Por ejemplo, debes escribir: "0.3", no ".3".

URL no permitida

Tu mapa del sitio incluye URLs en un subdominio diferente o un dominio diferente al del mapa del sitio.

Por ejemplo, si tu mapa del sitio está ubicado en http://www.example.com/sitemap.xml, entonces las siguientes URLs serán inválidas para este mapa del sitio:

http://example.com / - falta "www".

www.example.com / - falta "http"

https://www.example.com / - usando "https", no "http".

Hay una sección especial dedicada a este error en el estándar del mapa del sitio:

https://www.sitemaps.org/protocol.html#location

"Las URLs que no se consideran válidas se excluyen de la consideración posterior."

Por lo tanto, incluso en la descripción del estándar, se recomienda encarecidamente colocar el archivo del mapa del sitio en el directorio raíz del sitio.

Para más detalles visita:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Todas las páginas dentro del mismo mapa del sitio tienen la misma prioridad

Las páginas que cambian con más frecuencia y son de mayor interés para los usuarios deben tener prioridad.

Para indicar la prioridad de la página, puedes usar la siguiente etiqueta (que varía de 0 a 1):

<priority>0.8</priority>.

Ten en cuenta que no todos los formatos de archivo de mapa del sitio admiten esta etiqueta.

En primer lugar, el motor de búsqueda se centrará en la etiqueta de tiempo de actualización del documento, ya que este es un valor más preciso. Cuando especificas la fecha exacta de los cambios de la página en tu mapa del sitio, el atributo de prioridad tiene menos peso. Por lo tanto, si la etiqueta contiene información actualizada, tener la misma prioridad de página no es un gran problema.

Sin embargo, asignar una alta prioridad a todas las URLs en el sitio tampoco tiene sentido porque esto simplemente hace que todas las páginas tengan la misma prioridad nuevamente.

Por ejemplo, si un motor de búsqueda decide asignar un presupuesto de rastreo de 30 páginas por día a un sitio con 1000 páginas, entonces aumentar la prioridad para todas las páginas no aumentará la velocidad a la que se indexan. 30 páginas continuarían siendo indexadas por día.

La mejor práctica es priorizar aquellas páginas que cambian con más frecuencia y son más importantes para obtener tráfico del motor de búsqueda. El resto de las páginas deberían tener una prioridad más baja. Esto equilibrará la indexación, asegurando que las páginas de mayor prioridad se indexen más rápido.

La etiqueta es particularmente significativa cuando se ha actualizado todo un sitio, ya que la última fecha de modificación es entonces igual en todas las páginas. La etiqueta se convierte entonces en el recurso alternativo. Asegurando una buena configuración con esta etiqueta, se asegura que las páginas más importantes se reindexen primero.