疯了疯了~真的是太卷了,大模型这是又要变天了吗?
于昨晚,Anthropic官宣:Claude 3来了~
用Anthropic的话说,Claude 3系列模型在推理、数学、编码、多语言理解和视觉方面,都树立了新的行业基准!
Anthropic,就是曾因和OpenAI在安全理念方面不合,而从OpenAI“出走”的员工组成的初创公司。这一出手就给老东家一份暴击大礼啊~。
Claude 3分为三个版本,分别为Claude 3 Opus、Sonnet和Haiku,名称暗示了每种型号的能力,其中Opus是最强大的,Haiku是市场上最快、最具成本效益的模型。
并且在多模态和语言能力指标上,Claude 3都超越了其他同类。浅看一下这份成绩单,就十分扎眼~
几项数学类评测都是用0-shot超越GPT-4的4-8 shot。
除此之外,此前就以长下文窗口见长的Claude,此次全系列大模型可提供 200K 上下文窗口,并且接受超过100万Tokens输入。
首先,在性能参数上,Claude 3全系多方面全面提升。其中Opus在MMLU、GPQA、GSM8K等评估基准上领先于其他所有模型。
在视觉能力上,它能可以处理各种视觉格式,包括照片、图表、图形和技术图表。
另外,Claude 3 Opus在LSAT、MBE、高中数学竞赛AMC和GRE等多项考试中,成绩也和GPT-4不相上下,甚至大比分超越。
目前可以免费体验第二强Sonnet,Opus最强版供Claude Pro付费用户使用,但大模型竞技场也可以白嫖。Sonnet也已经可以通过Amazon Bedrock,以及Google Cloud的Vertex AI Model Garden使用。随后,Opus和Haiku也将在这两个平台上推出。
另外,Opus和Sonnet也开放API访问,开发者可以立即使用。
有人直接艾特奥特曼:好了,你现在可以发布GPT-5了。
不过奥特曼可能还在烦马斯克的诉讼……
既如此,那就先免费来尝尝鲜~
目前官方页面已经更新,Claude展现了「理解和处理图像」这一功能,包括推荐风格改进、从图像中提取文本、将UI转换为前端代码、理解复杂的方程、转录手写笔记等。
即使是模糊不清的有年代感的手记文档,也能准确OCR识别:
底下写着:你正在使用他们第二大智能模型Claude 3 Sonnet。
But~ 可能是人太多的原因,尝试了几次都显示了失败~
不过,网友们也已经po出了一些测试效果,比如让Sonnet解谜题。
为其提供一些示例,要求它找出数字之间的关系,比如“1 Dimitris 2 Q 3”,意思是3是1和2相加的结果。
结果Sonnet成功解出-1.1加8等于6.9,所以“X”的值应该是6.9:
还有网友发现Sonnet现在也可以读取 ASCII 码了,直呼:这是GPT-4 ++的水平了。
在编程任务上,谁写的代码好先不说,Claude 3至少不会像GPT-4一样偷懒。
还有体验到了Opus的玩家,在线给模型挖坑,可opus硬是完美躲避不上当:
初看这效果,感觉还行。这时候应该艾特OpenAI:GPT-5在哪里?
好了今天的分享就到这里了~
本文链接:https://houze.cc/gpt5/41.html
chatgpt5是什么时候发布chatgpt5.0官网chatgpt5.0怎么研发chatgpt5.0下载及注册方法chatgpt5.0能做一些什么gpt5.0 会员要交钱是真的吗gpt5可以帮助人类实现什么gpt5.0国内中文版下载gpt5将于第四季推出openai在中国申请gpt5商标
网友评论