• El resultado de tu última búsqueda en Google puede que no haya sido satisfactorio, pero hay razones.
  • Cada sitio web y red social aprende a "leernos" y, en su misión, suele fallar.
  • Te explicamos por qué las personas también tenemos la culpa de esto.
  • ¿Ya conoces nuestra cuenta de Instagram? Síguenos.

Necesitaba encontrar un viejo correo electrónico el otro día, eso es todo, es sencillo, pero me aterraban las posibilidades porque uso Gmail y mi frustración al buscar es alta.

Para esta tarea, la función de búsqueda de esa plataforma, tal y como saben millones de usuarios por amarga experiencia personal, hace que sea casi imposible encontrar lo que tanto te urge.

Buscas el número de confirmación de un vuelo, obtienes todos los boletines del programa de viajeros frecuentes.

Si buscas por el nombre del remitente, solo obtendrás los correos electrónicos más recientes, si es que logras encontrar algo relevante. Si buscas un archivo adjunto, no puedes saber qué mensaje contiene realmente el archivo o cuáles son solamente respuestas.

Me reiría a carcajadas si no me doliera la cabeza de tanto golpearla contra el escritorio.

¿Cómo es posible que la empresa que fabrica la mejor y más robusta tecnología para buscar en internet también fabrique un producto de correo electrónico en el que la función de búsqueda realmente no funciona?

Buscar en internet, ese momento de frustración extrema

Pero la verdad es que Gmail no es una excepción en esto. La búsqueda en Spotlight de Apple a menudo no ofrece resultados para documentos o archivos específicos que necesito y buscar en el Finder provoca que halle muchos resultados, ninguna respuesta y sí mucha frustración.

Las pantallas de Google Maps y Apple Maps están demasiado abarrotadas de funciones para ser vistas, especialmente en el móvil. Amazon literalmente te muestra cosas que no pediste, seguidas de sus propias imitaciones, antes de hacer un intento por localizar lo que escribiste en la barra de búsqueda. Instagram no tiene búsqueda de imágenes.

¿Buscas un tuit específico que recuerdas, incluso por el nombre del tuitero? Buena suerte.

Así que mi pregunta es la siguiente: ¿por qué la función de búsqueda es tan mala? Resolver cómo buscar cosas fue la clave de la integración de la web en la vida cotidiana, lo que hizo que el internet saliera de los sótanos de las universidades y llegara a nuestros bolsillos.

Ahora pareciera que nuestra habilidad para localizar y recuperar información está empeorando en lugar de mejorar, justo en el momento en que los hechos reales son el bien más preciado de la humanidad.

Cuando entramos en la era digital, tomamos la decisión colectiva de almacenar casi todo lo que sabemos (incluso nuestros recuerdos más personales e íntimos) fuera de nuestros cerebros.

En este punto, la búsqueda es la memoria, y cuando todos utilizamos las mismas herramientas ligeramente estropeadas para recordar, corremos el riesgo de olvidarnos de nosotros mismos.

Para entender cómo hemos llegado de allá hasta aquí (de nuestro pasado pulcramente organizado al presente irremediablemente desordenado) tenemos que comprender que la búsqueda se presenta en diferentes vertientes.

Diferentes tipos de información requieren diferentes tipos de búsqueda, pero todas las formas de búsqueda tienen algo en común, por decirlo en términos técnicos, todas ellas son terribles.

¿Por qué la búsqueda de correo electrónico es tan terrible?

En términos generales, hay dos tipos de búsqueda. Una es la de «elemento conocido», en la que se tiene en mente un hecho, un objeto o un destino específico; solo se necesita saber dónde está. La otra es «exploratoria», en la que desconoces lo que no sabes.

El correo electrónico es una especie de caso especial para buscar y esto genra frustración.

La gente suele saber que existe un correo electrónico específico, quién lo envió o cuándo. No obstante, esos criterios también pueden encajar con un montón de otros correos.

La mayoría de las veces, las personas quieren encontrar correos electrónicos recientes, del último mes o algo así, pero en ocasiones no es así. Suele recordar algunos detalles clave, como quién envió un correo electrónico o cuáles eran algunas de las palabras, pero a veces no lo recuerdan del todo bien.

«La razón por la que la búsqueda proporcionada por los proveedores individuales, incluyendo Gmail, es a menudo bastante horrible es que el problema subyacente es muy difícil», dice Sridhar Ramaswamy, un exejecutivo de Google que ahora es el CEO de Neeva, una startup de motores de búsqueda.

Gmail se quedó atrás

Cuando Google llegó, por primera vez resolvió el problema de las búsquedas de diversas formas ingeniosas.

La más famosa, de la que probablemente hayas oído hablar, se llama PageRank.

Contaba los «enlaces entrantes», es decir, el número de veces que otros sitios citaban el mismo resultado como fuente. Te daba la respuesta que el resto de internet consideraba buena.

Pero el poder más profundo de Google consiste en identificar de qué tratan esas páginas. Ademas de ser capaz de asociar el tipo de palabras que tú y yo podríamos buscar con el material que contienen esos sitios.

Y luego está el índice: el rastreo que Google actualiza periódicamente de todo internet o de una gran parte de él.

En la actualidad, el índice rastrea 100 millones de gigabytes de datos, cientos de millones de páginas web. Esa escala le da a Google una enorme ventaja. Cuenta con estadísticas sobre todas las cosas diferentes que la gente busca, y las formas en que lo hacen.

Por desgracia, la mayor parte de esa ventaja se evapora en Gmail. Sí, hay muchos correos electrónicos en el mundo. Según un libro sobre el problema escrito por un grupo de ingenieros de esa plataforma, la gente recibe más de 300,000 millones de correos electrónicos cada día.

Esto considerando las cosas generadas por máquinas como los recibos o las notificaciones.

Eso parece un cuerpo de datos lo suficientemente grande como para que las estadísticas a escala de Google funcionen.

Pero el correo electrónico no es una cosa colectiva como la web. La bandeja de entrada es tuya. No importa cuántos correos tengas ahí (leídos o no leídos, yo no juzgo), no es suficiente para que un motor de búsqueda tipo Google funcione correctamente.

«Los algoritmos que utiliza para buscar noticias no necesariamente van a ser efectivos», comentó Ian Ruthven, científico de la información de la University of Strathclyde. «Aunque para ti sea enorme, es diminuto, y las estadísticas no funcionan del todo bien».

A pesar de que Gmail está encantado de ayudar a los anunciantes a dirigirse a ti en función de tu comportamiento mediante el correo electrónico, no recoge ni comparte información sobre cómo la gente busca su correo electrónico, sería una violación de la privacidad si lo hiciera.

Significa que los ingenieros de software que intentan crear capacidades de búsqueda en el correo electrónico no pueden recurrir fácilmente a los puntos comunes estadísticos.

No pueden aprender de la multitud. Tienen que basarse en datos de encuestas, de uso anónimo o en gigantescos depósitos de correo electrónico de empresas muertas.

Uno de los mayores archivos de investigación resulta ser todo el correo electrónico enviado dentro de Enron, la empresa de arbitraje energético que cayó en desgracia.

«En la búsqueda web, tienes una colección de documentos, las páginas web, y eso se comparte para todos los usuarios. Si buscas algo y haces clic en un resultado. Si yo busco lo mismo, Google puede utilizar datos y clics para mejorar mi búsqueda», explica Hamed Zamani. Es director asociado del Center for Intelligent Information Retrieval de UMass Amherst.

«El correo electrónico, tú tienes tu colección de correos, yo tengo la mía. La transferencia de conocimientos entre los clics, o cualquier información que Google obtenga de los usuarios, no se puede compartir.»

Básicamente, la búsqueda de correos electrónicos es un problema de codificación masivo repartido entre millones de usuarios.

Tratar de localizar uno, irónicamente, puede ser la actividad más solitaria de la era digital. Es el único momento en el que estamos realmente solos con nuestros datos.

Esto es lo que genera tanta frustración al buscar en sitios de noticias y redes sociales

La mayoría de los sitios web, sobre todo los de startups, no tienen el dinero o los conocimientos necesarios para crear su propia función de búsqueda.

Puedes hacer clic en la lupa de la página de inicio de un sitio de noticias, pero es probable que aparezcan artículos irrelevantes o que no se remontan lo suficiente al pasado.

Lo mismo ocurre si intentas, ante la frustración, buscar en redes sociales: se te indicarán muchos usos específicos de tus palabras de consulta, pero no necesariamente del usuario que realmente quieres.

Y si el sitio tiene una opción de «búsqueda avanzada» más calibrada, buena suerte encontrándola.

La ubicuidad de Google nos ha llevado a asumir que cualquier recuadro horizontal con una pequeña lupa a un lado funcionará como una búsqueda de Google. Pero no es así.

Los gigantes de internet como Amazon o Facebook invierten mucho tiempo y dinero en funciones de búsqueda, pero las organizaciones más pequeñas no pueden o no lo hacen.

Utilizan software de búsqueda estándar, productos como Elastic o Apache Lucene y lo personalizan un poco.

Son productos eficaces, pero no tienen las ventajas de escala que tiene Google y como la mayoría de la gente acabará empleándolo de todos modos, crear una función de búsqueda personalizada no vale la pena para la mayoría de las empresas.

«No es el corazón del negocio», detalla Doug Cutting, un constructor de motores de búsqueda retirado que ayudó a inventar Lucene. «Ellos tienden a no invertir».

Una tarea que Google nos enseñó y no se replica

Eso también significa que lo que Google nos ha entrenado a hacer («teclear palabras clave en la barra de búsqueda, una y otra vez, hasta encontrar lo que buscamos») no necesariamente funcionará en otros sitios.

«Cuando la gente desarrolla estos hábitos y luego se va a otro sitio esperando que el sistema sea igual de eficaz, suele llevarse una tremenda decepción», afirma Chirag Shah, científico de la información en la “University of Washington”.

Hay una solución sencilla al problema: las empresas podrían dar a los bots de Google acceso a sus sitios web.

El algoritmo ayudaría a los clientes a encontrar lo que están buscando. Pero eso expondría los datos internos de la empresa (y los hábitos y comportamientos de sus usuarios) a un gigante de Silicon Valley conocido por sus feroces instintos competitivos.

Dejar que Google se encargue de tu búsqueda significa permitirle que inmiscuya en tu negocio, literalmente.

«Regalar la puerta principal de tu producto te hace correr un riesgo increíble», asevera Ramaswamy.

«Facebook, Instagram, Twitter, Pinterest son excepcionalmente cuidadosos sobre lo que dejarán que haga Google y lo que no. Todos han aprendido que hay cero incentivos para simplemente entregar toda su información a Google».

Otro punto de frustración: buscar en sitios de compras por internet

Aquí la tarea de buscar es un problema, quizás, menos técnico, pero no le quita la frustración. No todos los sitios quieren mostrarte lo que quieres encontrar.

Digamos que quieres comprar algo, supongamos que buscas algo en Amazon, que antes se enorgullecía de utilizar filtros de recomendación de «usuarios como tú» y una sofisticada clasificación de resultados para mostrar sus productos.

Hoy ese sitio web te mostrará literalmente otras cosas primero, seguidas de sus propios productos de imitación, luego anuncios pagados, esto antes de dignarse a mostrarte lo que pediste.

Después de un par de décadas usando Google, todos estamos entrenados para asumir que los resultados de búsqueda se clasifican según la relevancia para nuestra consulta.

Pero el hecho es que un sitio web que intenta vender algo siempre jugará con los resultados para su beneficio.

El problema es que las opciones de búsqueda de un sitio de comercio no pueden ser totalmente pésimas; la gente no lo utilizaría: se te perdonaría que abandonaras Home Depot por McMaster-Carr solo por este motivo.

Un sitio que trata de venderte algo tiene que mostrar justo lo suficiente de lo que quieres comprar y de lo que te quiere vender; ese es el punto que asegura que la casa mantenga su margen de ganancia.

«Yo de hecho he trabajado en esos sitios, así que lo sé», cuenta Shah, científico de información.

«Tienen que equilibrar lo que aumentará su margen de ganancias y lo que dará al usuario la sensación de que está obteniendo un buen trato y un resultado relevante».

Una especialidad solo para quienes soportan la frustración: buscar en servicios de streaming

Streamers, manejados por grandes creadores de contenido como Netflix y Disney, son como la mayoría de los sitios web: no quieren que Google tenga acceso a datos que podrían brindar una ventaja competitiva.

Por eso, una simple consulta a Google no siempre arroja resultados especialmente útiles al buscar y puede poner «al límite» nuestra frustración.

También es la razón por la que la función de búsqueda en el Apple TV arroja resultados confusos en el mejor de los casos, porque los servicios de streaming no permiten a Apple acceder a sus datos.

¿Por qué querría HBO Max que sus clientes se pierdan en un mar de resultados utilizando la interfaz de Apple en lugar de buscar directamente en la de ellos?

En cuanto a la razón por la que su propia función de búsqueda interna no lo hace bien, eso se remonta al juego de los resultados.

Los representantes de los servicios de streaming con los que hablé hicieron hincapié en su enfoque en los algoritmos de recomendación, que te muestran contenidos basados en lo que pueden saber sobre tus preferencias a partir de lo que ya has visto.

Esto se debe, en parte, a que una búsqueda más directa te mostraría que sus colecciones son limitadas.

Si buscas cosas que no están ahí, podrías empezar a pensar en suscribirte a otro servicio. Así que te ofrecen proactivamente «Los Goonies», que sí tienen, antes de que empieces a buscar «Gremlins», que no tienen.

Algoritmos y más

Los algoritmos de recomendación basados en el comportamiento anterior son en realidad motores de búsqueda en los que las consultas están implícitas.

Muéstrame otras películas como esta. A eso se le llama »zero-query search» (‘búsqueda de cero consultas’). Si alguna vez has caído en una «trampa» de YouTube o Instagram, ya conoces el camino.

Pero de manera oblicua, cada búsqueda que hacemos tiene una búsqueda secreta e implícita de consulta cero incrustada en ella.

Indagamos sobre algo que solucione un problema intelectual o emocional, que nos haga sentir mejor de alguna manera no articulada.

Por eso las recomendaciones algorítmicas son tan perniciosas; funcionan; nos dan lo que queremos; confirman nuestras sospechas, nos reconfortan y nos dicen que teníamos razón sobre lo que ya pensábamos, incluso cuando no es lo que necesitamos.

¿Por qué Google también nos frustra?

Hay una razón por la que el nombre de la empresa es un verbo. No se trata solo de su participación en el mercado, que supera el 90%. Tampoco de su índice imbatiblemente masivo, ni siquiera de la rapidez con que responde a las consultas.

Puede que los días de los «10 links azules» (cuando la primera página de resultados se llenaba de forma fiable con los sitios más relevantes para encontrar la información que buscabas) se hayan terminado.

Pero sigue siendo cierto que, para la mayoría de las búsquedas, Google funciona.

Por supuesto, hay cierta tensión entre su producto «editorial» («los resultados de búsqueda») y sus anuncios.

Cada pocos meses, un nuevo artículo o informe (este es uno de ellos) confirma que cada vez más y más resultados de Google son resultados pagados, incluyendo un montón de spam directo, o estafas.

Al fin y al cabo, el objetivo de la optimización de los motores de búsqueda (SEO) («Search Engine Optimization») es que los sitios se abran camino hasta la cima de Google.

De un modo u otro, la mayoría de los resultados que obtienes son el producto de un esfuerzo concertado para ganar tu atención al buscar y sentir frustración.

Pandu Nayak, vicepresidente de búsquedas en Google, afirma que la dinámica de edición de anuncios es de buena fe.

«Si hablas con el equipo de anuncios, están muy enfocados en asegurarse de que sean realmente de ayuda. Son conscientes de que si no son útiles, es una receta para que la gente aprenda a evitarlos por completo».

No obstante, añade, «la búsqueda no es en absoluto un problema resuelto». Lo cual, si lo pensamos bien, es algo bastante sorprendente de decir para un vicepresidente del departamento que se encarga de ello en Google.

Una forma de pensar al buscar, no solo en línea o digital, es como un intento de interactuar con cualquier sistema de información organizada sin percibir un ápice de frustración.

Esto ya sea pidiendo a un bibliotecario de Alexandria que busque un pergamino; enviando a un secretario a hojear los archivos de un gabinete en el sótano dirigiéndose a las estanterías con un número decimal Dewey o tecleando palabras clave en la sintaxis de la función booleana formal en un terminal de LexisNexis en el escritorio de referencia.

Siempre estamos tratando de mirar fijamente a un abismo lleno de información y «engatusarlo» para que nos diga lo que sabe de una manera que tanto él como nosotros entendamos.

Buscar es un tema histórico

Las personas que comenzaron a pensar en cómo iban a funcionar las computadoras sugirieron firmemente que estos nuevos dispositivos resolverían tanto la búsqueda de elementos conocidos como la búsqueda exploratoria.

En 1945, Vannevar Bush, quien dirigió la investigación científica para el gobierno de Estados Unidos durante la Segunda Guerra Mundial, señaló que los «índices asociativos» (links básicamente) serían la clave de un dispositivo de procesamiento de información de escritorio (bueno, del tamaño de un escritorio) que él llamó memex.

Las primeras guías de la web, de hecho, eran literalmente listas de sitios web. Eso es lo que era originalmente Yahoo.

«La idea era intentar crear una jerarquía de temas por los que se navegaba», expone Nayak. «Era una gran manera de organizar la web cuando era pequeña. Pero rápidamente se volvió inviable». Simplemente había demasiado internet.

Google descubrió cómo buscar a través de ese vasto volumen tan rápidamente que los usuarios (sin frustración) podían simplemente hacer consultas de palabras clave una y otra vez, hasta que apareciera la respuesta correcta.

No importaba si se buscaba un elemento conocido (¿Michael Caine sigue vivo?) o simplemente se exploraba (¿Cuáles son las mejores películas de Michael Caine?). Utilizamos la misma herramienta para ambas cosas.

Pero con el paso del tiempo, en su afán por ser grande y exhaustivo, Google fue empeorando su capacidad de encontrar cosas pequeñas o poco conocidas.

«Intentan atender bien a la mayoría de los clientes la mayor parte del tiempo», asegura Ruthven, científico de la información.

«Si formas parte de la parte más ‘ancha’ de la fila, obtienes mejores resultados. Pero si haces una búsqueda inusual o tienes un gusto musical realmente inusual o algo así, obtendrás malos resultados».

La gran mayoría de internet es basura o cosas que no interesan a casi nadie. Google ignora casi todo eso, optimizando una fracción de sus páginas indexadas.

«De entrada, eso es un filtro», menciona Cutting, constructor de motores de búsqueda.

«Como optimización, solo han restringido lo que se busca». Y como la mayoría de la gente no quiere lo que Cutting llama «basura esotérica», Google acaba favoreciendo a los muchos sobre los pocos.

«La sensación de que la búsqueda está atontada», agrega Cutting, «se debe a que la búsqueda es algo convencional ahora».

Tropiezos ante los datos

Y eso solo va a convertirse en la normalidad. El enorme almacén de datos de Google le ha permitido crear un software capaz de entender y producir lo que se parece mucho al discurso humano.

Este tipo de «modelo de lenguaje amplio» significa que las interacciones de búsqueda en Google pueden llegar a parecerse menos a un intercambio de palabras clave por enlaces y más a una interacción con un bibliotecario de antaño, un intercambio de preguntas y respuestas. Pero eso será ilusorio.

Los algoritmos de Google podrán responder a consultas en 75 idiomas, pero seguirán procediendo de partes de la web en el índice que la empresa ha determinado como «un subgrupo de alta calidad».

La barra será más fácil de usar al buscar, pero las respuestas no serán más correctas y sí generarán más frustración.

Es difícil imaginar un desafío técnico a la hegemonía de Google. Muchos de los cerebros y muchos de los datos que podrían arreglar la búsqueda se pasan al Googleplex.

«Si nos fijamos en quién tiene los datos», dice Cuttings, «quién tiene acceso a lo que la gente realmente busca, si eres un académico, querrás conseguir una pasantía o un trabajo en un lugar como Google, y luego obtener permiso para publicar, porque ellos tienen todos los recursos que necesitas. El trabajo más avanzado se va a hacer en un sitio como Google o Microsoft o Yandex y eso es lamentable».

Aun así, más de media docena de startups esperan llegar al «rey.» Algunas ofrecen la posibilidad de personalizar lo que se busca y cómo se indaga, transparencia a la que Google renuncia en beneficio de respuestas cada vez más directas a las preguntas.

Neeva, la competencia de Google dirigida por Ramaswamy, promete una experiencia libre de anuncios que buscará tanto en la web como en la información de tu propio ordenador mientras protege tu privacidad, a cambio de una tarifa de suscripción.

O podrías mejorar tu búsqueda en Google, como sugieren algunos expertos en búsquedas, utilizándolo para buscar en Reddit y averiguar lo que dicen los humanos reales sobre tu frustración en consulta. Pero seguirías utilizando el mismo navegador.

¿Por qué tú, que sientes frustración, también fallas al buscar en internet?

Hace un par de meses, un crítico e historiador de cómics que me gusta tuiteó un panel de un viejo cómic de Batman.

Se trataba de una cosa meta de la edad de plata que mostraba al superhéroe sentado en lo que parece una biblioteca. Él estaba hojeando libros y quejándose de que sus editores de DC Comics lo están fastidiando para que elija sus mejores historias para una recopilación. «Los editores son hombres despiadados», afirma el personaje.

Mientras trabajaba en este artículo, pensé que sería divertido enviar ese panel de Batman a mi propio editor. Pero, por supuesto, no pude encontrar el tuit del historiador.

Utilicé la función de búsqueda básica de Twitter para combinar el nombre del tipo con algún lenguaje que recordara del tuit. Pero seguía sin aparecer.

Fui a la búsqueda avanzada de Twitter, hice lo mismo, añadí «los editores son hombres sin piedad» y «Batman», y seguí sin encontrar nada.

Desesperado (bueno, desesperadamente procrastinando, ya que se suponía que estaba escribiendo mi historia), abrí la cuenta de Twitter del escritor y empecé a recorrerlo. Nada. Cuando llegué demasiado lejos en el tiempo, me detuve, desconcertado.

Por una corazonada, fui a Google y escribí todo lo que recordaba sobre el tuit, excepto el nombre del escritor. Y ahí estaba, entre los 10 primeros enlaces azules.

Resulta que me había acordado mal de quién lo había tuiteado. Era otro crítico e historiador de cómics, que también me gusta. El problema no era la búsqueda, era yo.

La gente espera que Google o Bing o la lupa de su ordenador respondan a las preguntas como los bibliotecarios de antaño.

Esto incluso a preguntas complejas y abiertas que generan respuestas complejas y a menudo contradictorias.

«En algunos sentidos, los grandes motores de búsqueda nos han entrenado para comportarnos de ciertas maneras: consultas cortas, mirar principalmente la primera página de forma superficial», puntualiza Ruthven.

«En un escenario de búsqueda exploratoria en el que no se conoce el vocabulario o el dominio, no es un buen modelo para interactuar con un sistema de esta clase».

Y cuando una búsqueda no produce la respuesta añorada, ¿qué es lo más humano que se puede hacer? Seguir haciendo infinitas variaciones de la misma pregunta al buscar, una y otra vez, hasta que tengas frustración.

«Hemos visto en algunos de nuestros estudios que la gente sigue probando el mismo tipo de consultas una y otra vez. Eso con la esperanza de que dé los resultados correctos», comenta Shah, científico de la información. «No están dispuestos a cambiar mucho su comportamiento». 

Las búsquedas siempre se verán afectadas por lo que sabemos, o creemos saber, y por lo que desconocemos.

Nuestra propia certeza errante, nuestra errónea confusión de incógnitas desconocidas con incógnitas conocidas, pone límites a lo que escribimos en un cuadro de búsqueda.

Google es bastante bueno encontrando prácticamente lo que queremos a partir de nada más que una bolsa de palabras clave mal escritas. Por ello pensamos que somos bastante buenos buscando.

Cualquier fallo, asumimos, debe estar al otro lado de la pantalla. Pero la búsqueda, por necesidad, siempre involucrará una interfaz entre el ser humano y la máquina, una relación, por así decirlo.

Entonces, ¿cómo podemos arreglar nuestras problemáticas interacciones con la búsqueda? Sabiendo que una relación sana se basa en un diálogo abierto, pedí sugerencias a mi compañero de búsqueda.

«¿Cómo puedo arreglar nuestra relación?» Busqué en Google. «Afronten y acepten sus diferencias», respondió. Palabras para buscar.

AHORA LEE: Estos son los detalles más extraños del acuerdo de compra de Twitter por Elon Musk

TAMBIÉN LEE: Por qué el mensaje de «no autorizo» en Twitter no sirve para nada

Descubre más historias en Business Insider México

Síguenos en FacebookInstagramLinkedInTwitter y Youtube

AHORA VE: