从GPT-4到GPT-5的扩展规律是可行的,在当前领域不透明的情况下,预测算法的进步更加困难。最好的启发式方法是关注与OpenAI相关的人物,并阅读顶尖实验室发表的论文。
智能体(Agents)
GPT-5是否会具有智能体能力,或者它是否会像之前的GPT版本一样,是一个标准的语言模型,能够做很多事情但不能制定计划并根据这些计划采取行动以实现目标?这个问题之所以重要,将其分解为以下三个原因:
智能体对智能的重要性怎么强调都不为过。
我们知道这种能力的原始版本在某种程度上是可能的。
OpenAI一直在研究人工智能智能体。
为了获得隐性知识,人类会做事。但是,“做”在有助于学习和理解的方式上需要遵循反馈循环、实验、工具使用和一种将所有这些与现有知识池整合的方式(这正是AlphaZero所做的超越模仿学习的有针对性推理)。因此,对于一个智能体来说,推理是一个手段,而不是目的(这就是为什么它在真空中没用)。推理提供了新的显性知识,然后AI智能体使用这些知识来规划和行动,以获得实现复杂目标所需的隐性知识。这是智能的精髓;这是AI的终极形态。
推理(Reasoning)
第一,互联网上的知识大多是显性知识(知道什么),但隐性知识(知道如何)无法通过言语准确传递,所以我们甚至不尝试——你在网上找到的大多是复杂迭代过程的最终产品(例如,你阅读我的文章,但你并不知道你不知道我必须经历几十次草稿)。 第二,模仿只是人类孩子学习工具箱中的众多工具之一。孩子们还进行实验,尝试试错,自我游戏——我们享受通过反馈循环与世界互动的多种学习方式,这些反馈循环更新知识和整合机制,将知识堆叠在现有知识之上。LLMs缺乏这些关键的推理工具。然而,DeepMind的AlphaGo Zero如何以100-0击败AlphaGo的——没有使用任何人类数据,只是通过自身玩游戏,利用深度强化学习(RL)和搜索的结合。
个性化(Personalization)
GPT-5和缩放定律(scaling laws)
模型大小趋势:从GPT到GPT-4,模型的参数数量有显著增长。GPT,2018 年(1.17 亿),GPT-2,2019 年(15 亿),GPT-3,2020 年(1.75 亿),GPT-4,2023 年(1.8 万亿,估计)
MoE架构:GPT-5预计将继续使用Mixture of Experts(MoE)架构,这种架构通过激活不同专家(小型专业模型)来处理输入,从而提高性能和推理效率。
参数数量预测:尽管有预测GPT-5的参数数量可能在2-5万亿之间,但确切的参数数量未知,因为模型的大小取决于多种因素,包括训练数据集的大小和可用的计算资源。
数据集大小
训练数据的重要性:根据Chinchilla缩放定律,更大的模型需要更多的训练数据来避免训练不足,确保模型性能的提升。
数据量与模型性能:数据显示,即使是过度训练,只要有足够的数据,模型如Llama 3依然能够持续学习并提升性能。
GPT-4的训练数据量:GPT-4已在大约12-13万亿个token上进行了训练,这个数据量为GPT-5提供了一个参考基点。
GPT-5的数据需求:如果GPT-5的模型大小与GPT-4相似,OpenAI可能需要进一步增加数据量,例如通过增加至100万亿个token,来实现性能上的提升。
数据收集策略:
使用Whisper模型转录YouTube视频,尽管这可能违反YouTube的服务条款。
利用合成数据,这在AI领域已成为一种常见且必要的做法,尤其是在可用的人造互联网数据减少的情况下。
计算
GPU数量与模型性能:更多的GPU资源允许在相同数据集上训练更大的模型,并且可以进行更多轮次的训练,这有助于提升模型的性能,直至达到某个性能瓶颈。
性能提升的时间跨度:在2022年8月至2023年3月期间(GPT-4的训练周期),以及现在,性能提升可能与可用的计算资源有关。
OpenAI的资源访问:OpenAI能够访问Azure的数千台H100 GPU,这为其训练下一代模型提供了大量的FLOP(浮点运算次数),这是提升模型性能的关键因素。
MoE架构的优化:OpenAI可能发现了进一步优化混合专家(MoE)架构的方法,这可以在不增加训练或推理成本的情况下拟合更多的参数。
Alberto Romero对GPT-5的规模预估
GPT-5的规模估计:假设OpenAI使用25k H100 GPU训练GPT-5,而不是Thompson建议的25k A100。H100在训练大型语言模型(LLMs)时比A100快2到4倍,成本相似。如果GPT-5的训练周期为4-6个月,那么其参数规模可能在7-11T,是Thompson估计的两倍多。
GPT-5的潜在规模:如果考虑到现有的并行配置在推理时分配模型权重的能力,GPT-5的参数规模可能达到10-15T,是GPT-4的十倍。OpenAI也可能选择使模型更高效,即更便宜。
GPT-4的改进与成本效益:考虑到OpenAI持续改进GPT-4,部分新可用的计算资源可能会被重新分配,以提高GPT-4的效率/降低成本,甚至可能免费提供,以取代GPT-3.5。这可能会吸引那些知道ChatGPT存在但不愿付费或不知道3.5免费版和4付费版之间巨大差异的用户。
本文链接:https://houze.cc/gpt5/113.html
chatgpt5.0中文版下载怎么用chatgpt5.0chatgpt5.0会怎么样chatgpt5.0功能chatgpt5.0需要多少钱gpt5已经停了吗gpt5.0源码gpt5百科chat gpt5.0何时更新gpt5最先进吗
网友评论