OpenAI的o1模型很强!但GPT5比它强69倍

nidongde2024-09-22 22:25:0731

OpenAI 最强大的o1系列模型上线了,也就是传说中的「草莓」🍓。

o1有多强大呢?体验过的网友表示:「未来我的孙子可能会和 AI 约会。」

o1 系列包括三个型号:

o1:全新大模型天花板,功能强大,目前未公开。

o1-preview:o1 的早期版本,供 ChatGPT 付费用户和 API 用户使用。

o1-mini:速度更快、性价比更高,适用于推理和无需广泛世界知识的任务。

o1的推理能力一绝o1 擅长解决复杂问题,尤其是在编码、数学和科学方面超越了 GPT-4o,堪称理工科天才。

根据 OpenAI 以往的等级划分,o1 已实现 L2 级别的推理能力。

o1 能在35秒内写出其他模型无法完成的诗。

经典 AI 测试题「strawberry 有多少 r」也难不倒 o1。

再比如这道逻辑题:

这道题非常需要逻辑推理,还需要复杂且正确的表达。

o1在经过一番推理后,定义变量、理解问题、解决方程,给出了正确答案:公主8k岁,王子6k岁,其中 k 为正整数。

然而,很多人吐槽 o1 使用不便,这可能是因为他们没掌握使用技巧。

o1不会脑经急转弯

脑刚才我们说到o1是理工生,貌似不会脑筋急转弯。

问:

一开始我也是这么想的,直到我打开评论区。

捏妈,老鹰本来就会飞啊!

Claude 也犯过类似错误,但成功指出磁悬浮能力不能通过食物链传递。

类似的问题,o1一样回答错误。

那么,大家还期待GPT5吗?

大 V Mattew Sabia 表示,GPT5 比 o1 强大 69 倍,普通人可能难以理解其推理和逻辑能力。


博士生水平的o1碾压但不替代GPT4o

在多项人类考试和 ML 基准测试中,o1 的表现显著优于 GPT-4o。

在国际数学奥林匹克(IMO)的模拟考试中,GPT-4o 仅解决了 13% 的问题,而 o1 成功解决了 83%,几乎可媲美顶尖博士生。

在许多推理密集型基准测试中,o1 的表现可与人类专家相当。

o1怎么用?

ChatGPT Plus 和 Team 用户将可访问 ChatGPT 中的 o1 模型。

API 使用有条件,符合第 5 层资格也就是在API上消费超过 1000 美元的开发人员可以使用 o1。

o1-preview 和 o1-mini 可在模型选择器中手动选择。发布时,o1-preview 每周速率限制为 30 条消息,o1-mini 为 50 条。

OpenAI 计划后期为所有 ChatGPT 免费用户提供 o1-mini 访问权限。

GPT4o功能有:文本对话、实时联网查询、AI绘画、文档分析、图像分析。

本文链接:https://houze.cc/gpt5/115.html

人工智能chatgpt5chatgpt5.0如何安装chatgpt5.0怎么用chatgpt5. 0是什么chatgpt5.0学习能力暂停gpt5研发为什么暂停训练gpt5gpt5.0特点gpt5怎么试用gpt5参数量

相关文章

网友评论