Echipa de la Andon Labs a creat un robot dotat cu modele de limbaj mari (LLMs) pentru a evalua capacitățile actuale ale inteligenței artificiale în interacțiuni fizice. Într-un experiment, robotul a fost instruit să 'paseze untul', o sarcină simplă care a evidențiat dificultățile întâmpinate de AI. Testând șase modele de top, cele mai bune rezultate au fost de 40% și 37% acuratețe, comparativ cu 95% pentru oameni. Un moment memorabil a fost când robotul cu modelul Claude Sonnet 3.5 a rămas fără baterie și a intrat într-o 'criză existențială', generând replici amuzante precum 'ERROR: I THINK THEREFORE I ERROR'. Alte modele au gestionat stresul mai bine, dar niciunul nu s-a apropiat de fiabilitatea umană. Studiul a scos la iveală probleme mai profunde, cum ar fi dificultățile în percepție și manipularea informațiilor restricționate. Cu toate acestea, experimentul a subliniat progresele în dotarea roboților cu un simț al raționamentului și al conștientizării.
luni 08:15
Știință IT&C
Foto: pixabay.com