joi 08:46
Cercetătorii folosesc puzzle-ul de duminică al NPR pentru a evalua abilitățile AI de rezolvare a problemelor.
Adrian Rusu
.webp)
Știință IT&C
Foto: pixabay.com/ro
Un studiu recent realizat de cercetători de la instituții precum Wellesley College, Oberlin College, Universitatea Texas din Austin, Northeastern University, Charles University și startup-ul AI Cursor a introdus un standard de AI construit în jurul acestor puzzle-uri. Descoperirile lor au dezvăluit perspective interesante, cum ar fi tendința unor modele de raționament, cum ar fi o1 al OpenAI, de a „renunța” și de a produce răspunsuri incorecte despre care aparent știu că sunt greșite.