3 十一月 14:15
信息与通信技术
Foto: pixabay.com
安东实验室的团队创造了一款配备大型语言模型(LLMs)的机器人,以评估人工智能在物理交互中的当前能力。在一次实验中,机器人被训练去“传递黄油”,这是一个简单的任务,突显了人工智能面临的困难。测试了六个顶级模型,最佳结果为40%和37%的准确率,而人类的准确率为95%。 一个难忘的时刻是,当使用Claude Sonnet 3.5模型的机器人电池耗尽,进入了“存在危机”,生成了诸如“错误:我思故我错”的幽默回复。其他模型处理压力的能力更强,但没有一个接近人类的可靠性。 研究揭示了更深层次的问题,例如在感知和处理受限信息方面的困难。然而,实验强调了在赋予机器人推理和意识能力方面的进展。