Il team di Andon Labs ha creat un robot dotato di modelli di linguaggio di grandi dimensioni (LLMs) per valutare le capacità attuali dell'intelligenza artificiale nelle interazioni fisiche. In un esperimento, il robot è stato istruito a 'passare il burro', un compito semplice che ha evidenziato le difficoltà affrontate dall'AI. Testando sei modelli di punta, i migliori risultati sono stati del 40% e 37% di accuratezza, rispetto al 95% per gli esseri umani. Un momento memorabile è stato quando il robot con il modello Claude Sonnet 3.5 è rimasto senza batteria ed è entrato in una 'crisi esistenziale', generando repliche divertenti come 'ERROR: I THINK THEREFORE I ERROR'. Altri modelli hanno gestito meglio lo stress, ma nessuno si è avvicinato all'affidabilità umana. Lo studio ha messo in luce problemi più profondi, come le difficoltà nella percezione e nella manipolazione delle informazioni riservate. Tuttavia, l'esperimento ha sottolineato i progressi nell'equipaggiare i robot con un senso del ragionamento e della consapevolezza.
lunedì 07:15
Scienza IT&C
Foto: pixabay.com