• Una demanda acusa a OpenAI de robar datos personales de "millones de estadounidenses" para entrenar a ChatGPT.
  • La demanda alega que OpenAI rastreó la web para acumular grandes cantidades de datos sin el permiso de las personas.
  • También almacenó datos de registro de chat de los usuarios de ChatGPT, incluso a través de aplicaciones como Snapchat y Spotify, según la demanda.
  • ¿Ya conoces nuestra cuenta de Instagram? Síguenos.

OpenAI robó «cantidades masivas de datos personales» para entrenar a ChatGPT, alega una demanda.

La demanda colectiva afirma que la compañía de Sam Altman «secretamente» recolectó datos para entrenar sus modelos de lenguaje grande (LLM, por sus siglas en inglés) para que ChatGPT pudiera replicar el lenguaje humano.

«A pesar de los protocolos establecidos para la compra y el uso de información personal, los demandados adoptaron un enfoque diferente: el robo», escribieron los abogados en la demanda de 157 páginas, presentada el miércoles en la Corte de Distrito de los Estados Unidos para el Distrito Norte de California.

La demanda alega que OpenAI rastreó la web para acumular grandes cantidades de datos, incluida información extraída de sitios de redes sociales. El corpus de datos personales de propiedad intelectual de OpenAI, WebText2, por ejemplo, extrajo datos de publicaciones de Reddit y los sitios web a los que se vinculaban, afirma la demanda.

Los datos a los que se accedió incluían «información privada y conversaciones privadas, datos médicos, información sobre niños; esencialmente todos los datos intercambiados en internet que podría tomar, sin previo aviso a los propietarios o usuarios de dichos datos. Y mucho menos con el permiso de alguien», según la demanda.

Esto equivalía a «el robo negligente e ilegal de datos personales de millones de estadounidenses que ni siquiera usan herramientas de IA», afirma la demanda.

OpenAI no respondió de inmediato a la solicitud de comentarios de Insider, realizada fuera del horario laboral habitual.

La demanda también acusa a OpenAI de almacenar y divulgar información privada de usuarios

Además de robar las «huellas digitales» del público en general, la demanda afirma que OpenAI también almacena y divulga la información privada de los usuarios; incluidos los detalles que ingresan para crear cuentas de OpenAI, sus datos de registro de chat e información de redes sociales.

Junto con los usuarios de ChatGPT directamente, se incluye los datos de personas que usan aplicaciones que tienen ChatGPT integrado; entre ellas Snapchat, Stripe, Spotify, Microsoft Teams y Slack, alega la demanda. Las empresas no respondieron de inmediato a la solicitud de comentarios de Insider.

La demanda busca congelar temporalmente el acceso comercial y el desarrollo de los productos de OpenAI hasta que la compañía haya implementado más regulaciones y salvaguardas.

Eso incluye permitir que las personas opten por no participar en la recopilación de datos y evitar que sus productos «superen la inteligencia humana y perjudiquen a otros».

La demanda también busca una compensación financiera para las personas a cuyos datos se accedió para entrenar a los bots.

Además de OpenAI, el principal patrocinador de la compañía, Microsoft, también fue nombrado como demandado.

Los demandantes fueron identificados solo por sus iniciales, ocupaciones y estado. Esto, según sus abogados, era para «evitar un escrutinio intrusivo, así como cualquier reacción violenta potencialmente peligrosa».

La demanda de OpenAI expone los riesgos en privacidad que presentan las herramientas de IA generativa

La IA generativa, que puede crear texto, audio, imágenes y videos, ha ganado popularidad desde que OpenAI lanzó su ChatGPT en noviembre.

La gente ha estado utilizando la IA generativa para fines personales, profesionales y académicos; sin embargo, existen preocupaciones sobre su acceso a los datos.

Italia anunció en marzo una prohibición temporal de ChatGPT por cuestiones de privacidad. Las autoridades del país alegaron que no había ninguna base legal para justificar «la recopilación y el almacenamiento masivos de datos personales» utilizados para entrenar los algoritmos detrás de ChatGPT.

Algunas empresas —incluidas Amazon y Microsoft— han dado instrucciones a sus empleados para que no ingresen información confidencial en el chatbot. Samsung, mientras tanto, ha prohibido al personal las herramientas de IA generativa.

La demanda del miércoles dice que aunque las plataformas de IA «indudablemente tienen el potencial de hacer mucho bien en el mundo», también podrían crear un «riesgo potencialmente catastrófico para la humanidad».

Además de las preocupaciones de que podría perturbar masivamente los mercados laborales, se sabe que la IA difunde información falsa y algunas personas la han utilizado con fines maliciosos.

Los creadores de OpenAI han dicho que la IA podría superar la experiencia humana en la mayoría de las áreas en los próximos 10 años. A su vez, algunos críticos temen que la tecnología represente un riesgo existencial para la humanidad.

“Nos enfrentamos a riesgos inminentes e irrazonables de que el tejido mismo de nuestra sociedad se desmorone, a manos de corporaciones multimillonarias impulsadas por las ganancias”, dice la demanda.

“Empresas poderosas, armadas con capacidades tecnológicas sin precedentes y altamente concentradas, se han apresurado imprudentemente para lanzar tecnología de inteligencia artificial sin tener en cuenta el riesgo catastrófico para la humanidad en nombre del ‘avance tecnológico’”, dice la demanda.

AHORA LEE: La inteligencia artificial puede ser más una aliada de las empresas que un riesgo, señala líder de ciberseguridad de Microsoft Latam

TAMBIÉN LEE: 21.1% de los mexicanos asegura que su empresa usa activamente, o planea usar, inteligencia artificial

Descubre más historias en Business Insider México

Síguenos en FacebookInstagramLinkedInTwitterTikTok y YouTube

AHORA ESCUCHA:

AHORA VE: