• La semana pasada, el gigante de las búsquedas online tuvo que afrontar una filtración de datos personales que mostró cómo funcionaba su algoritmo.
  • Se reveló una base de datos que recoge miles de incidentes de privacidad registrados durante años por la empresa.
  • Además, los documentos apuntan a que Google no es muy honesto sobre las métricas más importantes que determinan qué sitios aparecen primero en su página de resultados.
  • ¡Nos vemos en TikTok!

Google, la firma de Mountain View, no está atravesando su mejor momento en cuanto a reputación y la semana pasada afrontó una filtración masiva de datos personales, donde se reveló cómo funciona su algoritmo de manera interna. 

Las grandes compañías tecnológicas acostumbran a tener bastantes problemas para impedir que se filtre algún tipo de información interna relacionada con su actividad.

Puede tratarse de una tarea complicada, ya que el producto con el que trabajan suele ser, precisamente, la información que generan los usuarios de sus plataformas. 

Sin embargo, las empresas del sector tecnológico tienen que hacer frente a la filtración de información; en el caso de Google, los últimos días han sido complicados.

Google no es honesto con sus métricas

«Durante más de una década, nos mintieron», denunció Erfan Azimi, CEO de EA Eagle Digital (una agencia de SEO), que encontró por primera vez la documentación filtrada.

Azimi dio a entender que Google no es honesto sobre las métricas más importantes que determinan qué webs aparecen en la mitad superior de su página de resultados.

Sin embargo, el calvario de la compañía tecnológica no acabó ahí. Y es que, tal y como publicó en exclusiva 404 Media, esta semana se volvió a filtrar información confidencial de Google.

Concretamente, el medio de comunicación especializado en tecnología tiene acceso a una base de datos que recoge miles de incidentes de privacidad registrados durante años por la empresa de Sundar Pichai.

Según una copia de una base de datos interna de Google —que cuenta con registros de al menos seis años—, la empresa recopiló accidentalmente datos de voz de niños, así como de viajes y direcciones de los usuarios de coches compartidos.

Además, hizo recomendaciones en YouTube basadas en el historial de los videos que consumen los usuarios. 

Según información de 404 Media, es posible que cada uno de estos incidentes, que no se habían hecho públicos anteriormente, solo afectó a un número pequeño de personas, y se solucionaran rápidamente.

Sin embargo, muestran cómo una de las compañías más poderosas del mundo, Google, gestiona —y a menudo no lo hace correctamente— una cantidad asombrosa de datos personales.

Los datos personales que gestiona Google

Entre las situaciones y datos a los que ha tenido acceso el medio tecnológico, se encuentra información de todo tipo: desde problemas con los propios productos de Google, prácticas de recopilación de datos; vulnerabilidades en proveedores externos utilizados por Google; errores cometidos por el personal de Google, hasta subcontrataciones u otras personas que han afectado a los sistemas o datos de Google. 

En un caso de 2016, un empleado de Google denunció que los sistemas de Google Street View transcribían y almacenaban números de matrícula de las fotos. 

«Desafortunadamente, el contenido de las matrículas también es texto y, aparentemente, se transcribió en muchos casos», detalló el trabajador.

«Como resultado, nuestra base de datos de objetos detectados desde Street View ahora contiene de forma involuntaria una base de datos de números de matrícula geolocalizados y fragmentos de números de matrícula», explicó.

«Quiero enfatizar que esto fue un accidente. El sistema que transcribe estos fragmentos de texto debería evitar las imágenes identificadas por nuestros detectores de matrículas; pero, por razones aún desconocidas, no fue así», añadió el empleado. 

Google también recopiló voces de niños

En otro ejemplo destacado por 404 Media, un servicio de voz de Google registró por error todo el audio que recibió —incluidos unos 1,000 datos de voces de niños— durante aproximadamente una hora.

«Se recopilaron aproximadamente 1,000 conversaciones de niños. El equipo eliminó todos los datos de voz registrados durante el periodo de tiempo afectado», decía el informe.

Google declaró a través de un comunicado que sus trabajadores «pueden señalar rápidamente posibles problemas de producto para que los revisen los equipos pertinentes».

Añadió que «cuando un empleado envía el aviso, se sugiere el nivel de prioridad al encargado de la revisión».

«Los informes obtenidos por 404 se remontan a hace más de seis años y son ejemplos de estos avisos. Estos se revisaron y resolvieron en su momento», explicó.

En algunos casos, estas alertas de los trabajadores resultaron no ser problemas en absoluto o eran problemas que los empleados encontraron en servicios de terceros», valoró la empresa.


AHORA LEE: Google reduce respuestas generadas por IA después de que la función Overviews sugiriera a usuarios comer pegamento

TAMBIÉN LEE: Las filtraciones de datos cuestan a empresas de Latam más de 2 millones de dólares en promedio, según reporte de IBM

Descubre más historias en Business Insider México

Síguenos en Facebook, Instagram, LinkedIn, TikTok, Threads, Twitter y YouTube

AHORA ESCUCHA:

AHORA VE: