Claude 3提前狙击GPT-5

nidongde2024-03-08 10:04:59102


疯了疯了~真的是太卷了,大模型这是又要变天了吗?

于昨晚,Anthropic官宣:Claude 3来了~

用Anthropic的话说,Claude 3系列模型在推理、数学、编码、多语言理解和视觉方面,都树立了新的行业基准!

Anthropic,就是曾因和OpenAI在安全理念方面不合,而从OpenAI“出走”的员工组成的初创公司这一出手就给老东家一份暴击大礼啊~。

Claude 3分为三个版本,分别为Claude 3 Opus、Sonnet和Haiku,名称暗示了每种型号的能力,其中Opus是最强大的,Haiku是市场上最快、最具成本效益的模型。

并且在多模态和语言能力指标上,Claude 3都超越了其他同类。浅看一下这份成绩单,就十分扎眼~

几项数学类评测都是用0-shot超越GPT-4的4-8 shot。

除此之外,此前就以长下文窗口见长的Claude,此次全系列大模型可提供 200K 上下文窗口,并且接受超过100万Tokens输入。

首先,在性能参数上,Claude 3全系多方面全面提升。其中Opus在MMLU、GPQA、GSM8K等评估基准上领先于其他所有模型。

尤其是,Opus在处理复杂任务时,展现了几乎与人类相媲美的理解和表达能力,是AGI领域的领跑者。
Claude 3系列模型在分析预测、创建细微内容、代码生成,以及用西班牙语、日语、法语等非英语语言交流的能力上都实现了显著进步。

在视觉能力上,它能可以处理各种视觉格式,包括照片、图表、图形和技术图表。

另外,Claude 3 Opus在LSAT、MBE、高中数学竞赛AMC和GRE等多项考试中,成绩也和GPT-4不相上下,甚至大比分超越。

在几分钟内,Opus就化身为经济学专家,分析了全世界的经济情况。

比如,它可以分析出美国GDP在下一个十年可能的范围。

目前可以免费体验第二强Sonnet,Opus最强版供Claude Pro付费用户使用,但大模型竞技场也可以白嫖。Sonnet也已经可以通过Amazon Bedrock,以及Google Cloud的Vertex AI Model Garden使用。随后,Opus和Haiku也将在这两个平台上推出。

另外,Opus和Sonnet也开放API访问,开发者可以立即使用。

有人直接艾特奥特曼:好了,你现在可以发布GPT-5了。

不过奥特曼可能还在烦马斯克的诉讼……

既如此,那就先免费来尝尝鲜~

目前官方页面已经更新,Claude展现了「理解和处理图像」这一功能,包括推荐风格改进、从图像中提取文本、将UI转换为前端代码、理解复杂的方程、转录手写笔记等。

即使是模糊不清的有年代感的手记文档,也能准确OCR识别:

底下写着:你正在使用他们第二大智能模型Claude 3 Sonnet。

But~ 可能是人太多的原因,尝试了几次都显示了失败~


不过,网友们也已经po出了一些测试效果,比如让Sonnet解谜题。

为其提供一些示例,要求它找出数字之间的关系,比如“1 Dimitris 2 Q 3”,意思是3是1和2相加的结果。

结果Sonnet成功解出-1.1加8等于6.9,所以“X”的值应该是6.9:


还有网友发现Sonnet现在也可以读取 ASCII 码了,直呼:这是GPT-4 ++的水平了。


在编程任务上,谁写的代码好先不说,Claude 3至少不会像GPT-4一样偷懒。

还有体验到了Opus的玩家,在线给模型挖坑,可opus硬是完美躲避不上当:


初看这效果,感觉还行。这时候应该艾特OpenAI:GPT-5在哪里?

与此同时,为了介绍自家的这三款模型,Anthropic更是一口气发了一份长达42页的技术报告。

报告地址:https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf

好了今天的分享就到这里了~

本文链接:https://houze.cc/gpt5/41.html

chatgpt5是什么时候发布chatgpt5.0官网chatgpt5.0怎么研发chatgpt5.0下载及注册方法chatgpt5.0能做一些什么gpt5.0 会员要交钱是真的吗gpt5可以帮助人类实现什么gpt5.0国内中文版下载gpt5将于第四季推出openai在中国申请gpt5商标

相关文章

网友评论