• Google presentó este miércoles a Gemini, el modelo de inteligencia artificial más potente de la compañía hasta la fecha.
  • Gemini está diseñado para ser una IA multimodal, lo que significa que puede generalizar y comprender, operar y combinar diferentes tipos de información al mismo tiempo—incluidos texto, código, audio, imagen y video.
  • Google planea implementar Gemini en una variedad de productos y servicios, incluidos Bard, el Pixel 8 Pro y su motor de búsqueda.
  • ¿Ya conoces nuestra cuenta en Threads? Síguenos.
 

Google lanzó este miércoles a Gemini, su modelo de inteligencia artificial más potente hasta el momento y que se convertirá en el principal rival de GPT-4 de OpenAI.

Anunciado en mayo durante el Google I/O 2023, Gemini es un modelo de lenguaje extenso desarrollado por DeepMind —la empresa de inteligencia artificial de Google— que puede potenciar desde chatbots hasta funciones que resumen texto o generan texto e imágenes originales basado en lo que los usuarios necesiten.

Básicamente, Gemini está diseñado para ser una IA multimodal, lo que significa que puede generalizar y comprender, operar y combinar diferentes tipos de información al mismo tiempo —incluidos texto, código, audio, imagen y video.

Esta habilidad le permite comprender mejor información matizada, así como responder preguntas o explicar el razonamiento detrás de temas complejos como la matemática o la física.

Por ejemplo, Gemini puede reconocer en tiempo real lo que una persona está dibujando o analizar la tarea de matemáticas desde una hoja de cuaderno y analizar qué respuestas son correctas e incorrectas y explicar por qué.

La primera versión de Gemini (1.0) también puede comprender, explicar y generar código de alta calidad en los lenguajes de programación más populares, incluidos Python, Java, C++ y Go.

Google tiene pensado ‘adaptar’ a Gemini de acuerdo a distintas necesidades

Google Gemini
Google

De acuerdo con Google, Gemini también es «flexible» y es capaz de ejecutarse de manera eficiente en prácticamente cualquier caso: desde centros de datos hasta dispositivos móviles.

Esto es posible porque la compañía optimizó Gemini 1.0 para tres tamaños:

  • Nano: el modelo más eficiente para tareas en dispositivos como smartphones.
  • Pro: el modelo diseñado para escalar una amplia gama de tareas.
  • Ultra: el modelo más grande y capaz para tareas altamente complejas.

Google dice que ha estado probando rigurosamente los diferentes modelos de Gemini y evaluando su desempeño en una amplia variedad de tareas: desde la comprensión de imágenes naturales, audio y video hasta el razonamiento matemático.

El desempeño de Gemini Ultra supera los resultados actuales de última generación en 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de modelos de lenguaje grande (LLM, por sus siglas en inglés).

Con una puntuación del 90.0%, Gemini Ultra es el primer modelo de IA que supera a los expertos humanos en Comprensión Masiva de Lenguajes Multitarea (MMLU, por sus siglas en inglés), que utiliza una combinación de 57 materias como matemáticas, física, historia, derecho, medicina y ética para evaluar tanto conocimiento mundial como habilidades para la resolución de problemas.

En cuanto a la seguridad de Gemini, Google dijo estar tomando precauciones adicionales para garantizarla. Esto incluye evaluaciones de seguridad integrales, investigaciones sobre riesgos potenciales y colaboración con expertos externos. A su vez, Gemini utiliza puntos de referencia como Real Toxicity Prompts para identificar y abordar contenido dañino durante su entrenamiento. También emplea clasificadores y filtros de seguridad dedicados para que sea inclusivo para todos.

Google agregó que continúa abordando desafíos conocidos como la factualidad para garantizar la precisión y confiabilidad de Gemini.

Google Bard también será potenciado por Gemini

La compañía tecnológica también dijo que llevará Gemini a Bard, el chatbot conversacional de Google lanzado hace unos meses.

Específicamente, Gemini se implementará en Bard en dos fases: a partir de hoy, el chatbot utilizará una versión de Gemini Pro en inglés para un razonamiento, planificación, y comprensión más avanzados. Y a principios de 2024, Google lanzará Bard Advanced, que brindará acceso a los modelos de IA y capacidades más avanzados, comenzando con Gemini Ultra. La compañía no aclaró si estos modelos más avanzados de Bard serán de paga.

La versión de Bard con Gemini Pro estará disponible en inglés en más de 170 países y territorios. Google dijo que planea expandirlo a diferentes modalidades y admitir nuevos idiomas y ubicaciones en los próximos meses.

Antes de presentarlo al público, Google dijo que analizó Gemini Pro mediante una serie de pruebas comparativas estándar de la industria. En seis de ocho puntos de referencia, Gemini Pro superó a GPT-3.5, incluso en MMLU, uno de los principales estándares clave para medir grandes modelos de inteligencia artificial, y GSM8K, que mide el razonamiento matemático a nivel de escuela primaria.

Además de eso, Google ajustó específicamente Gemini Pro en Bard para que sea mucho mejor comprendiendo, resumiendo, razonando, codificando y planificando.

Gemini también se usará en el Pixel 8 y otros servicios de Google

Google dijo que también implementará Gemini en el Pixel 8 Pro, que será el primer smartphone diseñado para ejecutar Gemini Nano. Este potenciará nuevas funciones como «Resumir» en la aplicación Grabadora y la implementación de Respuesta inteligente en Gboard, comenzando con WhatsApp.

Google dijo que también está empezando a experimentar con Gemini en su motor de búsqueda. La IA está haciendo que la Experiencia Generativa de Búsqueda (SGE) sea más rápida para los usuarios, con una reducción del 40% en la latencia en inglés en Estados Unidos.

En los próximos meses, Gemini también estará disponible en más de los productos y servicios de Google, como Anuncios, Chrome y Duet AI.

La apuesta de Google por la inteligencia artificial ha sido particularmente marcada este año

Para Google, hay mucho en juego en el lanzamiento de Gemini.

El gigante tecnológico ha intensificado sus inversiones en inteligencia artificial generativa este año, mientras busca ponerse a la par del desarrollo de la tecnología después de que el lanzamiento de ChatGPT de OpenAI — respaldado por Microsoft— en noviembre del año pasado marcara el inicio de una nueva «carrera armamentista» en el mundo de la tecnología.

Este año, Google ha estado trabajando arduamente para integrar tecnología de inteligencia artificial en prácticamente todos sus productos. Bard, por ejemplo, ahora tiene la capacidad de recolectar información de otras aplicaciones como Gmail, Maps, YouTube y más para dar respuestas más personalizadas y eficientes. En septiembre, la compañía anunció una serie de herramientas de inteligencia artificial generativa pensadas para la creación de contenido en YouTube.

«Creo que la transición que estamos viendo ahora con la IA será la más profunda de nuestras vidas, mucho mayor que el paso anterior a los dispositivos móviles o a la Web», dijo Sundar Pichai, CEO de Alphabet, matriz de Google, en un comunicado anunciando a Gemini.

De acuerdo con Pichai, la inteligencia artificial tiene el potencial de crear oportunidades para todos y traerá nuevas olas de innovación y progreso económico, impulsando el conocimiento, el aprendizaje, la creatividad y la productividad a una escala sin precedentes. Y Gemini será la pieza clave de Google para alcanzar esta meta más rápido.

AHORA LEE: Creadores de contenido en YouTube deberán revelar cuando usen inteligencia artificial en sus videos

TAMBIÉN LEE: La inteligencia artificial puede terminar siendo más grande que internet, según el CEO de Google

Descubre más historias en Business Insider México

Síguenos en Facebook, Instagram, Twitter, LinkedIn, YouTube, TikTok y Threads

AHORA ESCUCHA:

AHORA VE: