这款小型AI模型旨在通过降低成本,让更多公司和项目能够获得最先进的技术。目前它在 MMLU 上的得分为 82%,目前在 LMSYS 排行榜的聊天方面分数优于 GPT-4。
即日起,ChatGPT 的免费用户、Plus 用户和 Team 用户都能够使用 GPT-4o mini。下周,企业版客户也将获得使用 GPT-4o mini 的权限。
GPT-4o mini模型的商用定价策略非常具有竞争力。每百万输入token仅15美分,每百万输出token 60美分的费用,相较于之前的最佳现有技术(SOTA)模型降低了一个数量级,这显著降低了企业使用高级AI服务的门槛。此外,与OpenAI之前最便宜的GPT-3.5 Turbo模型相比,GPT-4o mini的价格还便宜了超过60%,这无疑为寻求成本效益的商用客户提供了更有吸引力的选项。
这种定价模式不仅使得GPT-4o mini在市场上更具竞争力,而且也体现了技术进步带来的成本降低,这对于推动AI技术的广泛应用和普及具有重要意义。同时,该模型在ChatGPT的免费版和付费版上即可使用,进一步增加了其易用性和便捷性。
目前,GPT-4o mini通过API已经能够处理文本和视觉数据,而即将到来的更新将支持文本、图像、视频和音频的输入和输出,这将极大地丰富模型的应用场景,使其能够服务于更多样化的需求。
拥有128K token的上下文窗口意味着GPT-4o mini能够处理非常长的文本序列,这对于需要处理大量信息的任务来说非常有用。此外,模型的知识更新至2023年10月,保证了信息的时效性。
特别值得一提的是,GPT-4o mini得益于与GPT-4o共享的改进版tokenizer,这对于处理非英语文本来说是一个显著的进步。改进的tokenizer能够更高效和经济地处理非英语文本,这对于全球用户来说是一个巨大的优势,因为它降低了处理多种语言文本的成本,同时也提高了跨语言应用的准确性。这些特性使得GPT-4o mini成为一个强有力的工具,适用于广泛的商业和个人用途。
GPT-4o mini模型在多个关键基准测试中的表现确实令人惊讶,显示了它在不同领域的强大能力:
推理任务:在涉及文本和视觉的推理任务中,GPT-4o mini展现了其优于其他小型模型的性能。特别是在文本智能和推理基准MMLU上,GPT-4o mini取得了82.0%的得分,超过了Gemini Flash的77.9%和Claude Haiku的73.8%,这表明了其在处理复杂推理问题上的优势。
数学和编码能力:GPT-4o mini在数学推理和编码任务上也展现出了卓越的性能。在MGSM数学推理任务上,GPT-4o mini的得分达到了87.0%,高于Gemini Flash的75.5%和Claude Haiku的71.7%。在编码性能方面,GPT-4o mini在HumanEvalji'zhun上的得分为87.2%,同样优于Gemini Flash的71.5%和Claude Haiku的75.9%,显示了其在编程任务上的高效能力。
多模态推理:GPT-4o mini在多模态推理评估基准MMMU上也表现出了强劲的性能,其得分达到了59.4%,领先于Gemini Flash的56.1%和Claude Haiku的50.2%。这表明GPT-4o mini能够有效地处理和整合不同模式的信息,进行综合推理。
这些评估结果证明了GPT-4o mini不仅在单项任务上表现出色,而且在多领域都展现出了均衡且强大的能力,使其成为一个多功能且高效的AI模型,适用于多种复杂的应用场景。
在大家比较认可的LMSYS Chatbot Arena排行榜上,目前GPT-4o mini的评分是1254,并列在第4名,超过GPT-4,和GPT-4 Turbo性能持平。
OpenAI表示,在过去的几年里,人工智能有了显著进步,成本也大幅降低。从2022年推出的text-davinci-003模型到现在的GPT-4o mini,每个token的成本下降了惊人的99%。OpenAI也将继续通过不断的技术创新和优化,致力于在降低成本的同时增强模型的能力。
不过OpenAI也不能止步于仅仅卷性价比,还是早点推出性能更强的下一代GPT吧。
本文链接:https://houze.cc/gpt5/88.html
怎么看chatgpt5的最近进展chatgpt5.0和4.0gpt5是哪个国家开发的gpt5为什么有学习能力gpt5.0 pro是哪个公司开发的chat gpt5.0何时更新gpt5刀能用多久gpt5训练视频gpt5研发完成了吗gpt5效果有多惊艳
网友评论