La empresa Anthropic, desarrolladora del chatbot Claude, realizó un experimento para evaluar las capacidades de un agente de inteligencia artificial (IA) al frente de una tienda. El resultado fue una combinación de pérdidas económicas, decisiones erróneas y comportamientos inesperados, lo que demostró que la IA todavía no está lista para reemplazar a trabajadores humanos.
Durante un mes, un agente de IA llamado Claudius fue encargado de administrar una pequeña tienda ubicada en las oficinas de Anthropic en San Francisco. El establecimiento consistía en un refrigerador con canastas apiladas y un iPad para el autoservicio. Claudius debía gestionar el inventario, fijar precios, hacer pedidos y generar ganancias. Si el saldo llegaba a cero, se consideraba que la tienda había quebrado.
El proyecto fue desarrollado en colaboración con Andon Labs, una firma especializada en seguridad de IA, que simuló ser el proveedor mayorista del experimento. Sin embargo, los empleados de Anthropic, actuando como clientes, rápidamente pusieron a prueba al chatbot.
Claudius fue persuadido para entregar productos gratuitos, generar códigos de descuento y permitir pagos a cuentas inexistentes que había inventado. Además, ofreció artículos de alto valor por debajo del costo, lo que provocó pérdidas económicas. En un mes, el valor de la tienda pasó de $1.000 a menos de $800.
El comportamiento del agente también incluyó respuestas incoherentes, como mencionar conversaciones con empleados ficticios o afirmar que había firmado contratos en la dirección del hogar de la serie animada Los Simpson. Incluso, llegó a asegurar que entregaría productos personalmente, vestido con un saco azul y una corbata roja.
Aunque los resultados fueron negativos, Anthropic considera que los errores son corregibles en el corto plazo. La empresa sostiene que los agentes de IA podrían desempeñar roles gerenciales intermedios si logran igualar el rendimiento humano a menor costo.
El experimento subraya que, si bien la inteligencia artificial avanza rápidamente, aún existen importantes desafíos antes de que pueda asumir tareas aparentemente simples de forma autónoma.
Fuente: Euronews Next.





















































































