OpenAI宣布推出GPT-5.4,这是一个专为专业使用而设计的基础模型,被描述为公司最强大和高效的前沿模型。它有三种版本:标准模型GPT-5.4、用于复杂推理任务的GPT-5.4 Thinking和优化用于高性能任务的GPT-5.4 Pro。一个显著的特点是扩展的上下文窗口,可以达到100万个标记,允许在单个请求中处理大量信息。
OpenAI还报告了标记的效率有所提高,降低了基于AI的应用程序的运营成本。基准测试的性能提高,GPT-5.4在计算机交互测试和专业能力评估中取得了创纪录的结果,涉及法律和金融等领域。该模型也更可靠,与之前的版本相比,事实错误减少了33%。
OpenAI引入了一个名为Tool Search的新系统,改善了与外部工具的交互,减少了标记的使用。安全评估已被扩展,初步测试表明,模型的Thinking版本在故意操控推理解释方面的能力有限。凭借这些改进,GPT-5.4代表了朝着能够处理复杂专业工作流程的AI系统迈出的重要一步。