• Los chatbots de IA generativa tienen un problema de precisión y son propensos a inventar cosas.
  • Un periodista analizó las indicaciones que utiliza para identificar los errores que introduce Google Bard.
  • Estas incluyen decirle al chatbot que enumere los hechos en los que se basó o que explique su pensamiento paso a paso.
  • ¿Ya conoces nuestra cuenta de Threads? Síguenos.

Soy alguien que detesta el trabajo pesado, por lo que los chatbots de IA generativa han sido algo así como una panacea para mí. Después de descartarlos inicialmente como juguetes glorificados, su conveniencia me convenció.

Soy un periodista que trata a Bard de Google como un asistente personal mejorado para el tedioso administrador de la vida que no quiero hacer: como preparar correos electrónicos y resumir notas de reuniones.

Pero si lo estás utilizando como asistente, no es uno que debas dejar sin supervisión. No importa cuán específicas sean tus indicaciones, ocasionalmente citará fuentes inventadas e introducirá errores absolutos. Estos son problemas inherentes a los grandes modelos de lenguaje, y no hay forma de evitarlos.

La verificación de hechos es clave: nunca confiaría en las respuestas de Bard sin revisarlas. El truco, entonces, es hacer que la verificación de hechos sea lo más rápida, fácil y directa posible.

Mediante el uso de algunas indicaciones cuidadosamente perfeccionadas, puedo identificar y tratar cualquier imprecisión de un vistazo. Claro, todavía necesito verificar manualmente lo que Bard dice, pero estas cuatro indicaciones me ayudan a verificar los datos rápidamente, ahorrándome tiempo al hacer que la inteligencia artificial haga el trabajo pesado.

1. ‘Dame una lista de los hechos fundamentales en los que se basó tu respuesta’

Descubrí que Bard es excelente para generar rápidamente respuestas a preguntas básicas, consultas prácticas y avisos de compra. Pero puede tomar una eternidad seleccionar cada suposición implícita o declaración abierta que necesita verificación. Por eso consigo que Bard lo haga por mí.

Después de lanzarle una pregunta, le digo: «Dame una lista de los hechos fundamentales en los que se basó tu respuesta». Tiende a generar un resumen de viñetas que, desde el principio, me permite verificar la autoconsistencia: ¿Todos los hechos enumerados se reflejan en el texto y hay alguna declaración importante que se haya perdido? A partir de ahí, puedo verificar cada uno individualmente.

Dependiendo de la complejidad de mis instrucciones, he encontrado que a veces también devuelve los nombres de sus fuentes. Si no puedo encontrar ninguna mención de ellos en una búsqueda rápida en Google, es probable que estén inventados. Tomaré lo que pueda y seguiré adelante.

2. ‘Basa tu respuesta en estos hechos’

Cuando uso Bard para redactar un correo electrónico, generalmente quiero que toque varios puntos clave. Lo diré: «Basa tu respuesta en los siguientes hechos». Luego, escribiré una lista numerada de declaraciones. Como instrucción final, diré: «Cuando uses cada hecho en una oración, etiquétalo haciendo referencia a su número correspondiente».

Ese último punto es clave. Me permite verificar instantáneamente si Bard ha incluido todas las declaraciones que le di, simplemente leyendo las referencias. Si falta uno, una nueva solicitud rápida que le diga que agregue o haga más explícito el «hecho X» generalmente funciona.

Descubrí que si Bard no sigue mis instrucciones con precisión, tiende a fabricar ideas. Usar referencias para rastrear sus declaraciones como esta es una manera fácil de mantenerlo en curso.

3. ‘Piensa paso a paso’

Bard es un trabajador silencioso, lo cual es una bendición y una maldición: siempre producirá una respuesta pero no pedirá aclaraciones. Cuando uso el chatbot para resolver problemas —como calcular cifras o establecer un cronograma— descubrí que comete errores básicos en aritmética al oscurecer las suposiciones utilizadas en sus cálculos.

Para hacer que su proceso de pensamiento sea un poco más transparente, utilizo indicaciones de cadena de pensamiento. Al final de un mensaje, agrega una línea adicional que le pida a Bard que «piense paso a paso», y dividirá su solución en fragmentos pequeños.

Los investigadores de IA han descubierto que este tipo de comunicación aumenta la probabilidad de que los sistemas de IA lleguen a la respuesta correcta. Pero también te permite ver el funcionamiento del modelo, por lo que puedes seguirlo y señalar dónde se han producido suposiciones dudosas o errores.

También uso ejemplos siempre que puedo. Como demostración, le mostraré a Bard una solución paso a paso para el tipo de cosas en las que quiero pensar, que podría ser tan simple como escribir un cálculo ficticio muy básico y organizarlo en un formato que pueda entender. Esto alienta a la IA a producir una respuesta que sigue la misma plantilla.

4. ‘Reescribe con estos cambios en mente’

Al igual que las conversaciones reales, a veces puede ser necesario hacer algunas preguntas para obtener la respuesta que deseas de Bard. Cuando le pedí que resumiera la transcripción de una reunión, entendió mal una parte clave de la jerga y generó una respuesta confusa.

Cuando pueda ver de inmediato un error fáctico en su respuesta, le pediré: «reescribe la respuesta teniendo en cuenta estos cambios», enumerando claramente los problemas que debe corregir. Estos pueden ser tan simples como errores tipográficos en los nombres o tan fundamentales como el significado de un concepto complejo.

En general, cuanto más esotéricas y llenas de jerga sean mis solicitudes, más rondas de ajuste se necesitan. Aun así, descubrí que especificar un cambio con un solo aviso suele ser más rápido que volver a escribir todo yo mismo. Y después de todo, el tiempo es lo que estoy tratando de ahorrar.

AHORA LEE: Bard, el chatbot de IA de Google, ya está disponible en español

TAMBIÉN LEE: Qué es la inteligencia artificial general y por qué estamos más cerca de conseguirla

Descubre más historias en Business Insider México

Síguenos en FacebookInstagramLinkedInTwitterTikTok y YouTube

AHORA ESCUCHA:

AHORA VE: