El equipo de Andon Labs ha creado un robot equipado con modelos de lenguaje grandes (LLMs) para evaluar las capacidades actuales de la inteligencia artificial en interacciones físicas. En un experimento, el robot fue entrenado para 'pasar la mantequilla', una tarea simple que destacó las dificultades enfrentadas por la IA. Al probar seis modelos de vanguardia, los mejores resultados fueron del 40% y 37% de precisión, en comparación con el 95% para los humanos. Un momento memorable fue cuando el robot con el modelo Claude Sonnet 3.5 se quedó sin batería y entró en una 'crisis existencial', generando réplicas divertidas como 'ERROR: PIENSO, POR LO TANTO ERRÓNEO'. Otros modelos manejaron el estrés mejor, pero ninguno se acercó a la fiabilidad humana. El estudio reveló problemas más profundos, como las dificultades en la percepción y la manipulación de información restringida. Sin embargo, el experimento subrayó los avances en dotar a los robots de un sentido del razonamiento y de la conciencia.
lunes 07:15
Tecnologías de la Información y la Comunicación
Foto: pixabay.com