• Google está desarrollando un nuevo modelo de lenguaje grande llamado Gemini 1.5.
  • Gemini 1.5 ofrece mejoras sobre su predecesor al procesar una variedad de tipos de datos.
  • El nuevo modelo utiliza un modelo de 'mezcla de expertos' para la eficiencia y tiene una ventana de contexto más grande.
  • ¡Nos vemos en TikTok!

Google acaba de aumentar la apuesta en la guerra de la IA, creando una feroz competencia entre las grandes empresas tecnológicas y las startups.

El gigante tecnológico, propiedad de la empresa matriz Alphabet, Inc., anunció que tiene un nuevo modelo de lenguaje grande, o LLM, en desarrollo, llamado Gemini 1.5. La primera versión de esta tecnología, Gemini 1.5 pro, será lanzada pronto para pruebas tempranas, según The Verge.

La noticia, que fue detallada en una publicación de blog de la empresa escrita la semana pasada por el CEO de Google y Alphabet, Sundar Pichai, y el CEO de Google DeepMind, Demis Hassabis, llega solo dos meses después de que Google presentara el original Gemini, que está destinado a ser una respuesta al GPT-4 de OpenAI y otros LLM que están siendo creados tanto por startups como por grandes empresas tecnológicas.

Gemini es un modelo de IA multi-modal de próxima generación, lo que significa que la tecnología puede procesar más de un tipo de datos, incluyendo una combinación de imágenes, texto, audio, video y lenguajes de programación.

La tecnología está destinada a ser utilizada como una herramienta de negocios y asistente personal. Gemini no es la primera incursión de Google en la IA: más bien, la empresa tecnológica a principios de febrero realizó una «limpieza» de sus diferentes herramientas de IA y las renombró todas para que fueran Gemini.

En Gemini 1.5, las mejoras a la nueva tecnología son enormemente superiores a lo que el Gemini original puede hacer. Esto es lo que sabemos sobre ella hasta ahora.

Utiliza un modelo de ‘mezcla de expertos’

Gemini 1.5 promete ser más rápido y eficiente gracias a una técnica de especialización llamada «mezcla de expertos», también conocida como MoE.

En lugar de ejecutar todo el modelo cada vez que recibe una consulta, el MoE de Gemini puede usar solo las partes relevantes de su poder de procesamiento para generar una buena respuesta.

El poder de un modelo de IA está determinado por su ventana de contexto, que está compuesta por los bloques de construcción utilizados para procesar información. Estos pueden incluir palabras, imágenes, videos, audio o código. En el mundo de la IA, estos bloques de construcción se conocen como tokens.

El Gemini original podía manejar hasta 32,000 tokens. Sin embargo, la capacidad de la ventana de contexto de Gemini 1.5 Pro puede manejar hasta 1 millón de tokens. Esto significa que el nuevo LLM puede analizar más datos que la versión anterior: 1 hora de video, 11 horas de audio, bases de código con más de 30,000 líneas de código o más de 700,000 palabras, dijo la publicación de blog de Google.

Comparado con versiones anteriores, tiene un rendimiento mejorado

Al probar el nuevo modelo de IA contra sus predecesores, Gemini 1.5 Pro superó al anterior en el 87% de las pruebas de referencia que Google utiliza, dijo la empresa.

Además, el 99% de las veces, Gemini 1.5 fue capaz de encontrar un pequeño fragmento de texto en bloques de datos tan largos como un millón de tokens durante las pruebas conocidas como evaluación de «aguja en un pajar».

Gemini 1.5 también está mejorando en generar buenas respuestas a partir de consultas súper largas, sin que un usuario necesite pasar mucho tiempo adicional ajustando sus consultas.

Google dijo que los usuarios de prueba le dieron a Gemini 1.5 un manual de gramática para un idioma oscuro, y el LLM fue capaz de traducir texto al inglés a un nivel similar al aprendizaje humano.

Se sometió a pruebas de seguridad mejoradas

A medida que la IA se vuelve más fuerte, también lo hacen las preocupaciones sobre el papel de la tecnología en cuestiones de seguridad, desde la armamentización hasta el engaño.

Google dice que al lanzar Gemini 1.5, se sometió a extensas pruebas de ética y seguridad para darle luz verde para un lanzamiento más amplio. La empresa tecnológica ha realizado investigaciones sobre los riesgos de seguridad de la IA y ha desarrollado técnicas para mitigar el daño potencial.


AHORA LEE: Probé las Vision Pro de Apple por una hora y llevaba años sin sorprenderme así

TAMBIÉN LEE: Sam Altman acaba de recordarle a todos por qué OpenAI es el líder de la manada

Descubre más historias en Business Insider México

Síguenos en Facebook, Instagram, LinkedIn, TikTok, Threads, Twitter y YouTube

AHORA ESCUCHA:

AHORA VE: