Cómo hacer un histórico SEO cuando nadie sabe qué se ha hecho y el anterior seo se dio a la fuga.

Lost letters

No es nada raro hablar con un posible cliente que te pide propuesta y que te diga que “No sabe bien qué se ha cambiado de la web y el anterior SEO is missing”.

La importancia de documentarlo todo con fechas, explicaciones de para qué y por qué así, junto a la persona que lo implantó y una forma de contacto es muy importante. Este tipo de seguimiento básico permite el traspaso del proyecto a quien venga detrás, reduce costes al cliente y permite mejorar la escalabilidad del proyecto. Sabemos qué se ha hecho, cuando y quién.

Cuando esto no se ha hecho puedes recopilar información sobre el proyecto en la medida de lo posible, pero ¿qué pasa si ha habido una migración anterior de la que ya no quedan restos de nada?

  1. ¿Qué urls existían antes?
  2. ¿Se han redireccionado a las actuales?
  3. ¿Cuáles se han dejado morir?
  4. ¿Han cambiado títulos, encabezados, descriptions, etc…?
  5. ¿Tienen más o mejor contenido?

¿Y si además de todo esto no tenemos acceso a Search Console porque no estaba dado de alta el proyecto, ni Google Analytics ni información de ningún tipo?

Parece complicado, pero haciendo uso de Waybackmachine, Screaming Frog y Excel podemos rescatar cierta información más o menos fiable, ya que dependerá de los registros que tenga Waybackmachine, pero eso es mejor que nada.

Buscando la última versión pre migración.

Teniendo en cuenta la fecha de migración, buscamos la versión última anterior a la nueva, en este caso la migración se hizo a finales de 2019 y la fecha es del 6 de noviembre.

Captura de pantalla 2020 06 10 a las 9.33.00

Y aquí el snapshot de la versión previa.

web antigua

Y aquí la actual

web nueva

Recopilando información con Screaming Frog

Con la url ya identificada pasamos a meterla en Screaming frog para empezar a recopilar datos de información.

Waybackmachine contruye las urls en base al /[año][dia][mes][hora]/ con lo que lo ideal es crawlear la url añadiendo filtros como por ejemplo exclusiones de todos los años anteriores.

Captura de pantalla 2020 06 10 a las 9.58.25

Obteniendo un listado de urls con mucha mierda que habrá que limpiar…

screaming

Limpiando el contenido con Microsoft Exel

Ya con esto tenemos las urls a bulk, muy feas y con el prefijo https://web.archive.org, con lo que habrá que limpiarlas con excel. Una opción es buscar y reemplazar todo lo que empiece por https://web.archive.org/ y reemplazarlo por “nada”.

Se puede utilizar los datos en columnas para usar como separadores las / y eliminar también las fechas… La idea es recopilar el máximo numero de urls posibles en el intervalo.

Con todo esto… y “guarreando” un poco el archivo excel, ya que es un trabajo tedioso y feo podemos sacar un listado con las principales métricas…

urls screaming

Y esas son las urls pre-migración de las que disponemos…

Obteniendo las redirecciones con Screaming Frog

Ahora, sólo queda pasar esas urls por screaming frog para ver o”intentar ver” qué han hecho en la migración, con lo que veremos aquellas que no se ha hecho nada, aquellas que se han mantenido o aquellas que se han redireccionado.

urls match

Obteniendo a nivel global…

image

Por último, lo ideal… sería comprar títulos, descripciones, encabezados, etc… para ver si al menos lo “básico” se ha mantenido, mejorado o empeorado.

Otro factor es ver los ratios de texto/código de urls antiguas para ver si el contenido era de poca calidad y se ha mejorado con la nueva versión del sitio o incluso ha empeorado.

Por último, otra opción es la de usar herramientas como Semrush o Hrefs para conseguir enlaces a las urls del dominio y poder conseguir urls que no aparecían en Wayback Machine…

Más info con Semrush

Para ello, filtrar los enlaces por”lost” o perdidos puede ayudar mucho…

Captura de pantalla 2020 06 14 a las 20.34.13

Por último, un pequeño truco, es buscar el archivo robots.txt donde si tenemos suerte está cacheado por WaybackMachine y podemos acceder al sitemap.xml donde aparecerá todo el listado de urls disponibles, aunque esta opción es difícil, puede ser un “pelotazo”.

Probando suerte con robots.txt y sitemap.xml cacheados

Captura de pantalla 2020 06 10 a las 11.04.49

Con esto, aunque sea una solución o “parche” alternativo podemos empezar a entender todo y construir un histórico de acciones SEO para plantear una estrategia y tener una visión de dónde estamos y por qué.

Un comentario en “Cómo hacer un histórico SEO cuando nadie sabe qué se ha hecho y el anterior seo se dio a la fuga.”

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *