• ¿Se está utilizando la enorme biblioteca de contenidos de YouTube para entrenar sus modelos de inteligencia artificial?
  • El CEO de YouTube, Neal Mohan, dice que los contratos de algunos creadores de contenido con la plataforma significan que su contenido podría usarse para entrenar estos modelos.
  • También dijo que si OpenAI entrenara a Sora en el video dentro del contenido de YouTube, violaría los términos de servicio.
  • ¡Nos vemos en TikTok!

Google está apostando fuerte por la inteligencia artificial. Los modelos de IA, incluido Gemini, requieren una gran cantidad de datos de entrenamiento para ser competitivos. Entonces, la siguiente pregunta natural es: ¿Google está utilizando su enorme biblioteca de videos de YouTube para promover estas ambiciones de inteligencia artificial?

Para ayudar a intentar responder esa pregunta, analizamos lo que dijo el CEO de YouTube, Neal Mohan, sobre el tema y lo que decían los términos de servicio de la plataforma, además de enviar algunas preguntas aclaratorias a su empresa matriz, Google.

En una entrevista se le preguntó a Mohan sobre la posibilidad de que Google utilice la enorme biblioteca de YouTube para entrenar sus modelos de inteligencia artificial.

En abril, The New York Times informó que «Al igual que OpenAI, Google transcribió videos de YouTube para recolectar texto para sus modelos de IA». Eso potencialmente viola los derechos de autor de los videos, que pertenecen a sus creadores.

Google puede usar el contenido de ciertos YouTubers para entrenar su IA

Mohan dijo que algunos creadores de contenido en YouTube tienen contratos específicos que pueden permitir que su contenido se utilice en el entrenamiento de inteligencia artificial.

«Google utiliza el contenido de YouTube realmente de acuerdo nuevamente con los términos de servicio o contratos individuales que podríamos tener con los creadores o quienes suben archivos a nuestra plataforma», dijo Mohan a Emily Chang de Bloomberg en una entrevista en abril.

«Muchos creadores tienen diferentes tipos de contratos de licencia en términos de su contenido en nuestra plataforma, muchos titulares de derechos los tienen», añadió.

Básicamente, parece que el CEO de YouTube está diciendo que cualquier entrenamiento de IA que la compañía esté realizando con el contenido de YouTube —ya sea extrayendo títulos o transcripciones de videos o el contenido del video en sí— se está realizando de una manera que respete los términos que los creadores de contenido han acordado.

«Y entonces, una parte de ese corpus de YouTube puede usarse para esos modelos, pero será de acuerdo con cualesquiera que sean los términos de servicio o el contrato que ese creador haya firmado antes de subir su contenido a YouTube», dijo Mohan.

Es probable que OpenAI también haya usado a YouTube para entrenar a sus modelos de inteligencia artificial

Como informó The New York Times, es posible que Google no sea la única empresa que usa YouTube para entrenar sus modelos de IA.

En una entrevista de marzo con The Wall Street Journal, se le preguntó a la CTO de OpenAI, Mira Murati, si Sora, la herramienta de generación de texto a video de IA de la compañía, estaba entrenada en contenido de YouTube. Ella respondió que «en realidad no estaba segura de eso».

Mohan dice que, dependiendo de los datos que OpenAI extraiga, si los hay, podría violar los términos de servicio de YouTube.

«Nuestros términos de servicio permiten que algunos contenidos de YouTube, como el título de un vídeo o el nombre del canal o el nombre del creador, sean eliminados porque así es como se habilita la web abierta para que ese contenido aparezca, y tal vez aparezca en otros motores de búsqueda y estar disponibles de esa manera», dijo Mohan a Chang.

«Pero no permite que se descarguen cosas como transcripciones o fragmentos de video y eso es una clara violación de nuestros TOS», agregó.

Los términos de uso de contenido en YouTube no dejan claro si los videos pueden ser usados por Google para entrenar modelos de inteligencia artificial

Los términos de servicio de YouTube definen el contenido como «videos, audio (por ejemplo, música y otros sonidos), gráficos, fotografías, texto (como comentarios y guiones), marcas (incluidos nombres comerciales, marcas comerciales, marcas de servicio o logotipos), funciones interactivas, software, métricas y otros materiales; ya sean proporcionados por ti, YouTube o un tercero».

A su vez, los términos dicen que quienes suben archivos «retienen los derechos de propiedad sobre su Contenido»; sin embargo, también «otorgan ciertos derechos a YouTube y otros usuarios del Servicio».

«Al proporcionar Contenido al Servicio, usted otorga a YouTube una licencia mundial, no exclusiva, libre de regalías, sublicenciable y transferible para usar ese Contenido (lo que incluye reproducirlo, distribuirlo, preparar trabajos derivados, exhibirlo y ejecutarlo) en relación con el Servicio y el negocio de YouTube (y sus sucesores y Afiliados); incluso con el fin de promover y redistribuir parte o la totalidad del Servicio», dicen los términos.

Entonces, si bien los comentarios de Mohan y los términos de servicio de YouTube arrojan más luz sobre el asunto, todavía no está del todo claro si Google podría utilizar videos promedio de YouTube con fines de capacitación de IA y cómo.

Business Insider contactó a Google para preguntarle si estaba entrenando alguno de sus modelos o productos de IA —como su recientemente anunciado generador de texto a video, Veo— en los archivos de video reales del contenido de YouTube.

Actualizaremos esta publicación si recibimos una respuesta.

AHORA LEE: Cómo la IA y los influencers virtuales están invadiendo YouTube y las redes sociales

TAMBIÉN LEE: Creadores de contenido en YouTube deberán revelar cuando usen inteligencia artificial en sus videos

Descubre más historias en Business Insider México

Síguenos en Facebook, Instagram, LinkedIn, TikTok, Threads, Twitter y YouTube

AHORA ESCUCHA:

AHORA VE: