OpenAI 悄悄放大招？人人免费？GPT-4o Mini发布：API降价60%

nidongde2024-07-19 13:04:00189

继国内厂商卷大模型价格之后，还没「休息」几天，OpenAI终于也卷进来了，OpenAI 官宣推出 GPT-3.5 Turbo 的替代品——GPT-4o mini，顾名思义，这是 GPT-4o 更小参数量的简化版本。

这款小型AI模型旨在通过降低成本，让更多公司和项目能够获得最先进的技术。目前它在 MMLU 上的得分为 82%，目前在 LMSYS 排行榜的聊天方面分数优于 GPT-4。

即日起，ChatGPT 的免费用户、Plus 用户和 Team 用户都能够使用 GPT-4o mini。下周，企业版客户也将获得使用 GPT-4o mini 的权限。

GPT-4o mini模型的商用定价策略非常具有竞争力。每百万输入token仅15美分，每百万输出token 60美分的费用，相较于之前的最佳现有技术（SOTA）模型降低了一个数量级，这显著降低了企业使用高级AI服务的门槛。此外，与OpenAI之前最便宜的GPT-3.5 Turbo模型相比，GPT-4o mini的价格还便宜了超过60%，这无疑为寻求成本效益的商用客户提供了更有吸引力的选项。

这种定价模式不仅使得GPT-4o mini在市场上更具竞争力，而且也体现了技术进步带来的成本降低，这对于推动AI技术的广泛应用和普及具有重要意义。同时，该模型在ChatGPT的免费版和付费版上即可使用，进一步增加了其易用性和便捷性。

OpenAI CEO 山姆・奥特曼对此的形容是：通往智能的成本已经「too cheap to meter」。

目前，GPT-4o mini通过API已经能够处理文本和视觉数据，而即将到来的更新将支持文本、图像、视频和音频的输入和输出，这将极大地丰富模型的应用场景，使其能够服务于更多样化的需求。

拥有128K token的上下文窗口意味着GPT-4o mini能够处理非常长的文本序列，这对于需要处理大量信息的任务来说非常有用。此外，模型的知识更新至2023年10月，保证了信息的时效性。

特别值得一提的是，GPT-4o mini得益于与GPT-4o共享的改进版tokenizer，这对于处理非英语文本来说是一个显著的进步。改进的tokenizer能够更高效和经济地处理非英语文本，这对于全球用户来说是一个巨大的优势，因为它降低了处理多种语言文本的成本，同时也提高了跨语言应用的准确性。这些特性使得GPT-4o mini成为一个强有力的工具，适用于广泛的商业和个人用途。

下面，我们来具体看一下GPT-4o min在一些关键benchmarks上的表现：

GPT-4o mini模型在多个关键基准测试中的表现确实令人惊讶，显示了它在不同领域的强大能力：

推理任务：在涉及文本和视觉的推理任务中，GPT-4o mini展现了其优于其他小型模型的性能。特别是在文本智能和推理基准MMLU上，GPT-4o mini取得了82.0%的得分，超过了Gemini Flash的77.9%和Claude Haiku的73.8%，这表明了其在处理复杂推理问题上的优势。
数学和编码能力：GPT-4o mini在数学推理和编码任务上也展现出了卓越的性能。在MGSM数学推理任务上，GPT-4o mini的得分达到了87.0%，高于Gemini Flash的75.5%和Claude Haiku的71.7%。在编码性能方面，GPT-4o mini在HumanEvalji'zhun上的得分为87.2%，同样优于Gemini Flash的71.5%和Claude Haiku的75.9%，显示了其在编程任务上的高效能力。
多模态推理：GPT-4o mini在多模态推理评估基准MMMU上也表现出了强劲的性能，其得分达到了59.4%，领先于Gemini Flash的56.1%和Claude Haiku的50.2%。这表明GPT-4o mini能够有效地处理和整合不同模式的信息，进行综合推理。

这些评估结果证明了GPT-4o mini不仅在单项任务上表现出色，而且在多领域都展现出了均衡且强大的能力，使其成为一个多功能且高效的AI模型，适用于多种复杂的应用场景。

在大家比较认可的LMSYS Chatbot Arena排行榜上，目前GPT-4o mini的评分是1254，并列在第4名，超过GPT-4，和GPT-4 Turbo性能持平。