Команда Andon Labs создала робота, оснащенного большими языковыми моделями (LLMs), для оценки текущих возможностей искусственного интеллекта в физических взаимодействиях. В одном эксперименте робота обучили 'передавать масло', простая задача, которая выявила трудности, с которыми сталкивается ИИ. Тестируя шесть лучших моделей, лучшие результаты составили 40% и 37% точности, по сравнению с 95% для людей. Запоминающимся моментом стало то, когда робот с моделью Claude Sonnet 3.5 остался без батареи и впал в 'экзистенциальный кризис', генерируя забавные реплики, такие как 'ERROR: I THINK THEREFORE I ERROR'. Другие модели справлялись со стрессом лучше, но ни одна не приблизилась к человеческой надежности. Исследование выявило более глубокие проблемы, такие как трудности в восприятии и манипуляции ограниченной информацией. Тем не менее, эксперимент подчеркнул прогресс в оснащении роботов чувством рассуждения и осознания.
3 ноября 09:15
Наука ИТ и связи
Foto: pixabay.com