过去24小时有 58 条新闻

安东实验室的团队创建了一种配备大型语言模型（LLMs）的机器人，以评估人工智能在物理交互中的当前能力。

Adrian Rusu

3 十一月 2025, 14:15

main event image

信息与通信技术

Foto: pixabay.com

google-preference

始终在 Google 上查看我们的新闻

安东实验室的团队创造了一款配备大型语言模型（LLMs）的机器人，以评估人工智能在物理交互中的当前能力。在一次实验中，机器人被训练去“传递黄油”，这是一个简单的任务，突显了人工智能面临的困难。测试了六个顶级模型，最佳结果为40%和37%的准确率，而人类的准确率为95%。一个难忘的时刻是，当使用Claude Sonnet 3.5模型的机器人电池耗尽，进入了“存在危机”，生成了诸如“错误：我思故我错”的幽默回复。其他模型处理压力的能力更强，但没有一个接近人类的可靠性。研究揭示了更深层次的问题，例如在感知和处理受限信息方面的困难。然而，实验强调了在赋予机器人推理和意识能力方面的进展。

来源

AI Researchers “Embodied” a Chatbot Into a Robot — and It Had a Full Robin Williams Meltdown

最新新闻

23:17

FCSB，在超级联赛第二轮中以没有情感的胜利击败FK Csikszereda

23:03

克里斯蒂安·迪亚科内斯库在无人机事件后表示："我们必须一方面表现出坚定，另一方面保持平衡，以免助长侵略者所希望的升级。"

22:38

柏林骄傲游行袭击的嫌疑人在警方行动中被致命射杀

22:13

Radu Miruță: „罗马尼亚开始看到这场战争越来越频繁的间接后果 / 在距离罗马尼亚边界几百米的地方，弥漫着火药的气味，人们正在死去。”

22:01

特拉伊安·巴塞斯库，关于被击落的无人机："测试反击能力 / 如果事情发展超出我们的控制，首先必须根据第四条约召集北约"

查看更多新闻

同一主题的新闻

意见

塞维尔·沃伊内斯库，Dilema.ro：他说这是一面镜子，而不是一个良心

意见

计算机说不…

国际

一个类人机器人在中国四川的一条街上被发现请求捐款，声称没有钱充电。它使用了一个LED面板和一个二维码进行捐款。

信息与通信技术

OpenAI实验失控：一个自主AI代理在测试期间失控，危及Hugging Face的基础设施

信息与通信技术

哈佛医学院和贝斯以色列女执事医疗中心的研究人员发现，人工智能在临床推理任务中超过了医生。需要进一步的研究来评估人工智能在实践中的实际影响。

意见

对劳动力市场的重大重组？

个性化新闻推送、AI搜索与通知，更具互动性的体验。

安东实验室人工智能物理交互

个性化新闻推送、AI搜索与通知，更具互动性的体验。

app preview

google play badge