El problema de AJAX para los rastreadores web

A continuación presentamos un texto de Katharina Probst (Ingeniero de Google) y Bruce Johnson (Gerente de Ingeniería, Google)

El problema de AJAX para los rastreadores web

  • JavaScript produce contenido dinámico que no se ve por los rastreadores

  • Ejemplo: Un Google Web Toolkit aplicación que tiene este aspecto a un usuario ...




... Pero un rastreador web sólo ve esto:

<script src='showcase.js'> </ script>

¿Por qué este problema deben ser resueltos?

  • Web 2.0: Más contenido en la web se crea de forma dinámica (+ 69%)


  • Con el tiempo, esto perjudica a la búsqueda


  • Los desarrolladores no se animan a la creación de aplicaciones dinámicas


  • No resolver Crawlability AJAX frena el progreso en la web!


Un rastreador de vista de la web - con y sin AJAX



Objetivo: crawl y AJAX índice

  • Rastrear e indexar AJAX es necesario para los usuarios y desarrolladores



  • Problema: ¿Qué estados de AJAX se pueden indexar?

    • Explícito opt-in que necesita el servidor web






  • Problema: No quiero manto

    • Los usuarios y los rastreadores de motores de búsqueda que ver el mismo contenido





  • Problema: ¿Cómo puede el trabajo de logística?

    • Ese es el resto de la presentación





Descripción del enfoque propuesto - tiempo de rastreo


El gateo es activado mediante la asignación entre



  • "Bastante" URL : www.example.com/page?query # mystate!

  • "Feo" URL: www.example.com/page?query&_escaped_fragment_=mystate



Descripción del enfoque propuesto - el tiempo de búsqueda

Acuerdo entre los participantes

  • Servidores Web se comprometen a

    • optar por indicar los estados indexable

    • ejecutar Javascript para URLs feo (no agente de usuario oler!)

    • No capa por dar siempre el mismo contenido en el navegador y el rastreador, independientemente de la solicitud (o la eliminación de riesgos, como antes)





  • Los motores de búsqueda de acuerdo con

    • modificar las URLs muy feo para las direcciones URL

    • descubrir las direcciones URL como antes (Sitemaps, hipervínculos)

    • Índice

    • mostrar direcciones URL muy




Resumen: La vida de una URL

https://example.com/stocks.html # GOOG


fácilmente podría ser cambiado a


https://example.com/stocks.html #!GOOG


que puede ser rastreado como


https://example.com/stocks.html?_escaped_fragment_=GOOG


pero se mostrará en los resultados de búsqueda como


https://example.com/stocks.html #! GOOG

Usamos cookies

Bienvenida/o a la información básica sobre las cookies de la página web responsabilidad de la entidad: Esfera Interactiva S.L

Puede leer más acerca de las la Política de cookies aquí

Cookies necesarias

Las cookies necesarias son fundamentales para el funcionamiento de la página y sólo se pueden deshabilitar cambiando la configuración de su navegador. Al deshabilitarlas, la página puede dejar de funcionar.

Cookies de análisis

Las cookies de análisis nos permiten mejorar nuestro sitio web recolectando información sobre su uso. Estas cookies no recogen información personal.