Openai的Chatgpt Maker周三宣布,发布了两种称为O3和O4-Mini的推理AI模型,这些模型旨在在他们回答之前暂停并通过问题进行工作。
AI初创公司宣布这是一周后,这是删除其GPT-44月30日的Chatgpt语言模型,用具有出色性能的模型代替了它,而较小的其他型号则在管道中并准备好发布市场。
Openai将O3描述为有史以来最先进的推理模型
据报道,AI初创公司将其O3称为公司最先进的推理模型,因为它在测量数学,推理,编码,科学和视觉理解功能的测试上的其他模型优于其他模型。
“ O3和O4 Mini非常擅长编码,因此我们正在发布新产品Codex CLI,以使其更易于使用。”宣布Openai首席执行官Sam Altman在X平台上的帖子中。
“这是一种在您的计算机上运行的编码代理。它是完全开源的,今天可用,我们希望它会迅速改进。”
奥特曼。
至于O4-Mini,它提供了公司所说的是价格,速度和性能之间的竞争权衡。根据TechCrunch的说法,这些因素是开发人员在选择AI模型来供电其应用程序时经常考虑的因素。
OpenAI在评论其模型时坚持认为,O3在经过验证的SWE Bench(无定制脚手架)上实现了最先进的性能,这是一项测量编码能力的测试,模型得分为69.1%。
据该公司称,O4-Mini也以68.1%的成绩获得了相同的性能。这家初创企业的下一个最佳型号O3-Mini在测试中得分49.3%,而人类的Claude 3.7十四行诗得分为62.3%。
根据TechCrunch,O3模型几乎没有在Chatgpt发布,因为Altman在2月份表示该公司希望将更多的资源传递给精致的O3技术。
但是,竞争性压力似乎驱动了Openai最终逆转路线。
O3和O4-Mini非常擅长编码,因此我们发布了新产品Codex CLI,以使它们更易于使用。
这是在计算机上运行的编码代理。它是完全开源的,今天可用;我们希望它会迅速改善。
- 山姆·奥特曼(@sama)2025年4月16日
Openai希望保持领先于Google这样的竞争对手
新车型是在Openai努力保持领先地位的时候,尤其是Google,Meta,Anthropic,XAI和中国DeepSeek。
Openai是第一个发布AI推理模型O1的人。但是,竞争对手设法迅速使用自己的版本匹配或超过Openai阵容的性能。这也是因为推理模型开始统治该领域,因为AI实验室希望从其系统中表现出更多的性能。
与先前启动的其他推理模型相比,O3和O4-MINI模型具有使用ChatGPT中的工具生成响应的能力,例如,Web浏览,Python代码执行,图像处理和图像生成。
评论在公告中,AI爱好者将这一开发项目描述为“超级”,而巨大的举动是“本地编码是未来”。
“这是自插件以来Chatgpt的最大转变。但是更顺畅。一切都可以使用,模型选择了如何解决问题。这是朝着实际帮助的AI迈出的一步,而不仅仅是聊天。”
阿扎尔·艾哈迈德(Azhar Ahmed)。
据该公司称,Openai Pro的订阅者,Plus和Team Plans可以访问新车型,并加上O4-Mini的变体,称为“ O4-Mini-High”。这些花费更多的时间生成答案以提高可靠性。
Openai说,新型号是其第一个可以“使用图像思考”的型号。这意味着用户可以将图片上传到chatgpt,并且模型将在回答之前分析图像的“经过思考”阶段。凭借这种新功能,模型可以理解模糊和低质量的图像,并且可以执行诸如缩放或旋转图像之类的任务。
外部图像处理功能,这两个模型可以通过ChatGpt Canvas功能直接在用户浏览器中运行并执行Python代码,并在询问有关当前事件时搜索网络。
密码大都会学院:厌倦了市场波动?了解DEFI如何帮助您建立稳定的被动收入。立即注册
No comments yet