Interactivaclic

C/Ruíz Tagle, 3 - Planta 2
Torrelavega - 39300

942 180 083 / 942 148 958

Calidad de búsqueda: los 50 cambios de marzo

Esta es nuestra entrega más reciente con los puntos más destacados de la calidad de búsqueda, con los 50 nuevos cambios de marzo. Estamos empezando a familiarizarnos con el modo de hacer estos posts, así que cada mes abarcamos más y más sobre el tema. Entre las novedades de este mes está el video sin cortes de una reunión sobre calidad de búsqueda que publicamos, siendo una muy buena muestra del proceso mediante el cual se toman las decisiones.

Esta es la lista de los cambios de marzo:

  • Autocompletar con símbolos matemáticos. [nombre clave de lanzamiento “Blackboard”, nombre clave de proyecto “Suggest”] Cuando procesamos consultas para ofrecer predicciones en Autocompletar, generalmente las normalizamos para que hagan juego con predicciones más relevantes en nuestra base de datos. Este cambio incorpora varios caracteres que antes normalizábamos: “+”, “-”, “*”, “/”, “^”, “(“, “)”, y “=”. Esto debería facilitiar la búsqueda de ecuaciones conocidas, por ejemplo [e = mc2] o [y = mx + b].

  • Mejoras al manejo de símbolos para la indexación. [nombre clave de lanzamieno “Deep Maroon”] Generalmente ignoramos los signos de puntuación en las búsquedas. Con base en el análisis de nuestra fuente de consultas, hemos empezado a indexar los símbolos de mayor uso: “%”, “$”, “\”, “.”, “@”, “#”, y “+”. Seguiremos indexando más símbolos conforme al uso observado.



  • Una mejor clasificación para la agrupación de noticias. [nombre clave de lanzamiento “avenger_2”] Los resultados de búsqueda para Noticias en Google están organizados en grupos acerca de la misma historia. Tenemos sistemas de clasificado para determinar el orden de estos grupos para una consulta. Este sutil cambio mejora nuestro sistema de clasificación, lo que se traduce en un mejor posicionamiento de los conjuntos de noticias.


  • Actualización a los datos de enlaces de sitio. [nombre clave de lanzamiento “Saralee-76”] Los enlaces de sitio (los enlaces que aparecen debajo de algunos resultados de búsqueda y que enlazan hacia el interior del sitio) se generan en parte mediante un proceso fuera de línea que analiza la estructura del sitio y otros datos para determinar los enlaces más relevantes que se mostrarán a los usuarios. Recientemente actualizamos los datos a través de nuestro proceso fuera de línea. Estas actualizaciones suceden de forma frecuente (del orden de semanas).


  • Mejoras al backend de Autocompletar. [nombre clave de lanzamiento “sovereign”, nombre clave de proyecto “Suggest”] Hemos consolidado sistemas y reducido el número de llamadas al backend requeridas para preparar las predicciones de Autocompletar para una consulta. El resultado es un uso más eficiente de CPU y predicciones más completas.


  • Mejor manejo de cambios de contraseña. Nuestro enfoque general consiste en que cuando cambian de contraseña se cierre su sesión en todas los equipos. Este cambio asegura que cuando cambien su contraseña, haya un cierre de sesión más consistente en todas partes.


  • Un mejor indexado de páginas de perfil. [nombre clave de lanzamiento “Prof-2”] Este cambio mejora la cobertura de páginas de perfil públicas en nuestro índice para más de 200 sitios sociales.


  • Actualización a la interfaz de usuario para los resultados universales de Noticias. [nombre clave de lanzamiento “Cosmos Newsy”, nombre clave de proyecto “Cosmos”] Hemos actualizado el diseño de los resultados universales de Noticias ofreciendo más resultados en el grupo superior, unificando la interfaz de los grupos de diferentes tamaños, agregando una fuente más grande para los artículos destacados, agregando imágenes más grandes (de fuentes con licencia), y agregando información del autor.


  • Mejoras a los resultados para consultas de navegación. [nombre clave de lanzamiento “IceMan5”] Una consulta de navegación es aquella en donde el usuario parece querer navegar a un sitio web en particular, como el [New York Times] o [wikipedia.org]. Mientras que estas búsquedas parecen directas, sigue siendo un reto ofrecer los mejores resultados. Por ejemplo, ¿qué pasa si el usuario no conoce el verdadero URL? ¿Qué pasa si el URL que están buscando parece ser un dominio aparcado (sin contenido)? Este cambio mejora los resultados para este tipo de búsquedas.


  • Actualización de datos y mejoras al algoritmo de sitios de alta calidad. [nombre clave de lanzamiento “mm”, nombre clave de proyecto “Panda”] Como muchos de los cambios que hacemos, los aspectos de nuestro algoritmo para sitios de alta calidad dependen de procesamiento fuera de línea y su envío periódico. El mes pasado actualizamos los datos para “Panda”. También realizamos mejoras para mantener nuestra base de datos actualizada.


  • Resultados en tiempo real para la UEFA Champions League y KHL. Hemos agregado snippets que se actualizan en vivo a nuestros resultados de búsqueda para la KHL (Liga de Hockey Rusa) y la UEFA Champions League, incluyendo marcadores y calendarios. Ahora podrán encontrar resultados en vivo para un número de ligas deportivas (en los países en donde esté disponible), incluyendo a la NFL, NBA, NHL y otras.


  • Funcionalidad para búsquedas de Tennis. [nombre clave de lanzamiento “DoubleFault”] Hemos agregado una nueva funcionalidad de búsqueda que ofrece marcadores de tennis en tiempo real en la parte superior de la página de resultados de búsqueda. Prueben buscando [maria sharapova] o [sony ericsson open] (disponible en google.com en inglés).


  • Resultados de Búsqueda de imágenes más relevantes. [nombre clave de lanzamiento “Lice”] Este cambio ajusta las señales que usamos relacionadas con la calidad de imágenes en la página destino. Esto hace que sea más probable que encuentren imágenes más relevantes, incluso si esas imágenes están en páginas de baja calidad.


  • Predicciones de imágenes más actuales para todos los idiomas. [nombre clave de lanzamiento “imagine2”, nombre clave de proyecto “Suggest”] Recientemente implementamos un cambio para generar predicciones más relevantes en la búsqueda de imágenes para Autocompletar en inglés. Esta mejora extiende esta actualización a todos los idiomas.


  • Ajuste del algoritmo de Búsqueda segura (SafeSearch). [nombres clave de lanzamiento “Fiorentini”, “SuperDyn”; nombre clave de proyecto “SafeSearch”] Este mes aplicamos un par de cambios a nuestro algoritmo de Búsqueda segura. Actualizamos el clasificador para hacerlo más inteligente y más preciso, y encontramos nuevas formas de hacer menos probable la aparición de contenido adulto cuando el usuario no lo está buscando.


  • Ajustes al manejo de texto de anclaje. [nombre clave de lanzamiento “PC”] Este mes desactivamos un clasificador relacionado con el texto de anclaje (el texto visible que aparece en los enlaces). Nuestros datos experimentales sugieren que otros métodos de procesamiento de anclaje tienen un mayor éxito, así que desactivar este componente hace que nuestra clasificación sea más limpia y más robusta.


  • Simplificación de la base de códigos universal para imágenes. [nombre clave de lanzamiento “Galactic Center”] Hemos realizado algunas mejoras para simplificar nuestra base de códigos universal para imágenes y para utilizar mejor los cambios en nuestro posicionamiento web general para también mejorar los resultados de imágenes.


  • Mejor posicionamiento de aplicaciones y una mejor interfaz de usuario en móviles. Cuando busquen apps en su teléfono, verán resultados más completos, con iconos para las apps, estrellas de calificación, precios y botones para descargarlas configurados para las pantallas más pequeñas. También verán un posicionamiento de apps más relevante basado en la plataforma de su dispositivo, como por ejemplo Android o iOS.


  • Mejoras a la actualidad de resultados de búsqueda universales para videos. [nombre clave de lanzamiento “graphite”, nombre clave de proyecto “Freshness”] Hemos mejorado la actualidad de los resultados para videos para detectar mejor los videos viejos y mostrar contenido fresco.


  • Menos sinónimos no deseados. [nombre clave del proyecto “Synonyms”] Cuando buscan en Google, normalmente identificamos otros términos de búsqueda que pudieran tener el mismo significado que el que introdujeron en la caja de búsqueda (sinónimos) y mostramos resultados para esos términos también en el caso en que puedan ser útiles. Este mes ajustamos un clasificador para prevenir el uso de sinónimos inútiles en el contenido de los resultados de búsqueda.


  • Mejor manejo de consultas locales y de navegación. [nombre clave de lanzamiento “ShieldsUp”] Algunas consultas tienen tanto una intención local como de navegación (dirigidas hacia un sitio web en particular). Este cambio mejora el balance de los resultados que mostramos y nos ayuda a asegurarnos de que encontrarán resultados de navegación altamente relevantes o resultados locales en la parte superior de la página de manera apropiada para su consulta.


  • Mejoras a la actualidad. [nombre clave de lanzamiento “Abacus”, nombre clave de proyecto “Freshness”] Lanzamos una mejora a la actualidad o frescura al final del año pasado que fue de mucha utilidad, sin embargo tiene un costo computacional significativo. En aquel momento decidimos solo implementar este cambio para el tráfico relacionado a noticias. Este mes lo hemos aplicado para todas las búsquedas.


  • Mejoras al procesamiento para la detección de la calidad de los sitios. [nombre clave de lanzamiento “Curlup”] Hemos hecho algunas mejoras a nuestro sistema para detectar la calidad de los sitios. Esta mejora nos permite obtener un mayor grado de confianza para nuestras clasificaciones.


  • Una mejor interpretación y uso del texto de anclaje. Hemos mejorado los sistemas que usamos para interpretar y usar los textos de anclaje, y determinar que tan relevante es un ancla en particular para una búsqueda y un sitio web en particular.


  • Mejores resultados y fuentes locales en Google Noticias. [nombre clave de lanzamiento “barefoot”, nombre clave de proyecto “news search”] Estamos eliminando una señal que teníamos para ayudar a la gente a encontrar contenido local para su país, y estamos integrando una lógica similar a otras señales que utilizamos. Esto se traduce en resultados de Google Noticias más relevantes y locales y en fuentes de mayor calidad.


  • Dando de baja una señal relacionada con el posicionamiento dentro de un grupo de noticias. [nombre clave de lanzamiento “decaffeination”, nombre clave del proyecto “news search”] Estamos dando de baja una señal que ya no funciona para mejorar la relevancia de Google Noticias. Esta señal fue desarrollada originalmente para ayudar a la gente a encontrar artículos de mayor calidad en Google Noticias. (Nota: a pesar del nombre clave de lanzamiento, este proyecto no tiene nada que ver con el llamado Caffeine, nuestra actualización a la indexación presentada en 2010).


  • Menos sinónimos “hermanos”. [nombre clave de lanzamiento “Gemini”, nombre clave del proyecto “Synonyms”] Una de las principales señales que observamos para identificar sinónimos es el contexto. Por ejemplo, si la palabra “gato” usualmente aparece cerca del término “mascota” o “peludo”, al igual que la palabra “gatito”, nuestros algoritmos podrían adivinar que “gato” y “gatito” tienen significados similares. El problema es que en ocasiones este método puede introducir “sinónimos” que realmente son entidades distintas dentro de la misma categoría. Continuando con el ejemplo, los perros también son “mascotas peludas”, así que a veces “perro” pudiera ser utilizado de manera equivocada como un sinónimo de “gato”. Hemos estado trabajando por un buen tiempo para lograr separar a estos sinónimos “hermanos”, y nuestro último sistema es más fácil de mantener, actualizar, corregir y extender a otros sistemas.


  • Una mejor precisión y desempeño de los sinónimos. [nombre clave de proyecto “Synonyms”] Hemos realizado otras mejoras a nuestro sistema de sinónimos para eliminar la lógica duplicada. También hemos encontrado formas para identificar con mayor precisión a los sinónimos apropiados para los casos en donde existen múltiples sinónimos candidatos con diferentes contextos.


  • Ajuste del sistema de recuperación. [nombre clave de lanzamiento “emonga”, nombre clave de proyecto “Optionalization”] Hemos mejorado los sistemas que identifican términos en una consulta que no son necesariamente requeridos para recuperar documentos relevantes. Esto hará que los resultados sean más files a la consulta original.


  • Sinónimos menos agresivos. [nombre clave de lanzamiento “zilong”, nombre clave de proyecto “Sinónimos”] Hemos escuchado los comentarios de los usuarios acerca de que en ocasiones nuestros algoritmos son demasiado agresivos al incorporar resultados de búsqueda para otros términos. La causa suele ser nuestro sistema de sinónimos, el cual pudiera incluir resultados para otros términos en la mayoría de los casos. Este cambio hace que nuestro sistema de sinónimos sea menos agresivo en la forma en la que incorpora resultados para otros términos de búsqueda, otorgándole un mayor peso a la consulta original.


  • Actualización a los sistemas que se apoyan en datos geográficos. [nombre clave de lanzamiento “Maestro, Maitre”] Tenemos varias señales que se apoyan en los datos geográficos (similar a los datos que mostramos en Google Earth y Maps). Este cambio actualiza algunos de los datos geográficos que estamos utilizando.


  • Mejoras a la detección de nombres. [nombre clave de lanzamiento “edge”, nombre clave de proyecto “NameDetector”] Hemos mejorado un sistema para detectar nombres, particularmente para los nombres de celebridades.


  • Actualizaciones a las señales de personalización. [nombre clave de proyecto “PSearch”] Este cambio actualiza las señales utilizadas para personalizar los resultados de búsqueda.


  • Mejoras a la relevancia de la Búsqueda de imágenes. [nombre clave de lanzamiento “sib”] Hemos actualizado las señales para mejorar la promoción de imágenes de tamaño razonable con páginas de destino de alta calidad.


  • Dar de baja algunas señales para la relevancia de sitios. [nombre clave de lanzamiento “Freedom”] Hemos eliminado señales enfocadas a producto del algoritmo para el entendimiento de sitios.


  • Detección más precisa de páginas viejas. [nombre clave de lanzamiento “oldn23”, nombre clave de proyecto “Freshness”] Este cambio mejora la detección de páginas viejas (sin cambios) en nuestro índice al apoyarse en señales más relevantes. Como resultado, se mostrarán menos páginas viejas a los usuarios.


  • Ajustes a la detección de idioma en Autocompletar. [nombre clave de lanzamiento “Dejavu”, nombre clave de proyecto “Suggest”] En general, Autocompletar se apoya en el idioma de pantalla configurado para determinar las predicciones de idioma a mostrar. Para muchos idiomas, también tratamos de detectar el idioma que utiliza el usuario en la consulta al analizar el script, y este cambio extiende ese comportamiento para el chino (simplificado y tradicional), japonés y coreano. El efecto neto de esto es que cuando los usuarios olvidan deshabilitar sus IMEs, aún obtengan predicciones en inglés si empiezan a escribir términos en inglés.


  • Mejoras en la detección de fechas para las páginas de foros y blogs. [nombre clave de lanzamiento “fibyen”, nombre clave de proyecto “Dates”] Este cambio mejora el algoritmo que determina las fechas para foros y blogs.


  • Más predicciones en Autocompletar al reescribir en tiempo real los prefijos para una consulta. [nombre clave de lanzamiento “Lombart”, nombre clave de proyecto “Suggest”] En este cambio estamos reescribiendo consultas parciales al vuelo para recuperar más predicciones potenciales que hagan juego con las consultas de los usuarios. Usamos sinónimos y otras funcionalidades para obtener la mejor pareja. Los prefijos reescritos pueden incluir reordenamiento de términos, adición de términos, remoción de términos y más.


  • Enlaces de sitio extendidos en móviles. Hemos lanzado nuestra funcionalidad de enlaces de sitio extendidos para los navegadores móviles, ofreciendo una mejor organización y presentación de los enlaces de sitio en los resultados de búsqueda.


  • Respuestas cortas más acertadas. [nombre clave de proyecto “Porky Pig”] Hemos actualizado las fuentes detrás de nuestra funcionalidad de respuestas cortas para que se apoyen en datos de Freebase. Esto mejora la precisión y facilita corregir bugs.


  • Migración de los backends de las búsquedas avanzadas de video. Hemos migrado algunos backends utilizados en la búsqueda avanzada de video a nuestra infraestructura de búsqueda principal.


  • Botón +1 en búsquedas para más países y dominios. Este mes hemos internacionalizado el botón +1 en la página de resultados de búsqueda para más idiomas y dominios. El botón +1 en búsquedas facilita el compartir recomendaciones con el mundo directamente desde los resultados de búsqueda. Como dijimos en otro post, la belleza del +1 es su relevancia – obtienen las recomendaciones adecuadas (porque provienen de personas que son importantes para ustedes), en el momento adecuado (cuando están buscando información acerca de algún tema) y en el formato adecuado (en sus resultados de búsqueda).


  • Actualización de la Interfaz de usuario para resultados locales en tablets. Hemos actualizado la interfaz de usuario para los resultados locales en tablets para hacerlos más compactos y fáciles de recorrer.




Fuente: Google

Utilizamos cookies propias y de terceros para mejorar la experiencia de navegación, y ofrecer contenidos y publicidad de interés. Al continuar con la navegación entendemos que se acepta nuestra política de cookies.