近期,吴恩达教授在美国红杉 AI 活动上关于 Agent 的最新趋势与洞察。作为AI领域的领军人物吴恩达教授在此前提出了一个引人注目的观点:通过结合AI Agent工作流程,GPT-3.5的性能甚至可以超越其更先进的版本GPT-4。这一观点挑战了我们对AI模型性能的传统认知,也为智能体工作流程成为AI发展的主流方向提供了有力支持。
传统的AI模型,如GPT系列,通常采用零样本(Zero-shot)模式,即模型根据给定的输入直接生成输出,这种方式虽然在许多任务上表现出色,但仍存在局限性。相比之下,AI Agent工作流程则采用了一种更加迭代和自主的方法。它不仅分析问题,还能进行必要的研究,生成初步方案,并在此基础上不断自我检查和修正。
该套流程强调了智能体工作流的重要性,通过迭代过程,比如规划大纲、网络搜索、写初稿、修改草稿等步骤,可以显著提高AI生成文本的质量。这种迭代工作流对于人类作家来说是至关重要的,对于人工智能来说也同样有效,更使得AI能够更加深入地理解问题,并提供更加精准和细致的答案。
GPT-3.5与Agent workflow的结合
该团队通常在零样本(Zero-shot)模式下使用大语言模型(LLM),即让模型逐步生成输出而不进行任何修改。这种要求类似于一个人一气呵成地写完一篇文章,不允许回退修改,却期望文章能达到高质量。尽管这样做存在挑战,但吴恩达教授的团队在研究中发现,当GPT-3.5应用于一个迭代智能体循环中时,其表现可以提高到惊人的提高。在零样本(Zero-shot)模式下,GPT-3.5的准确率为48.1%。
GPT-4的表现更佳,达到了67.0%。
然而,从GPT-3.5到GPT-4的提升,并没有迭代智能体工作流带来的提升那么显著。
实际上,当GPT-3.5应用在一个迭代智能体循环中时,它的表现可以提高到惊人的95.1%。
这一结果不仅超过了GPT-3.5自身的水平,甚至与GPT-4相比也毫不逊色。
这也表明,通过智能体工作流程的迭代优化,即使是相对较小的模型也能够实现与更大模型相媲美的性能。
AI agents的概念及其优势在于它们能够以更加迭代和自主的方式工作。与传统的语言模型相比,AI agents会先分析问题,必要时进行研究,生成初步方案,然后不断自我检查和修正。这种工作方式能够显著提高语言模型的表现,有时甚至可以让较小的模型超越更大的模型。吴恩达教授又进一步介绍了AI Agent的四种设计模式,这些模式极大地拓展了语言模型的能力边界:1. 自反(Reflection):AI Agent能够自我审视和修正生成的内容。2. 工具使用(Tool Use):AI Agent可以使用各种工具进行分析、信息获取和行动。3. 规划(Planning):AI Agent能够自主制定计划,执行一系列步骤以完成复杂任务。4. 多智能体协作(Multiagent Collaboration):多个AI Agent可以协同工作,通过分配任务和互相配合来共同解决问题。
吴恩达教授认为,在实际应用中,随着智能体工作流程的出现,AI可以完成的任务将在今年得到大幅扩展。随着更强大的语言模型如GPT-5、GPT-4、Claude等的推出,AI技术将持续快速进步。智能体工作流程要求我们适应其与传统语言模型不同的特点。例如,AI Agent可能需要更长的时间来“思考”和迭代,这意味着我们需要耐心等待,而不是期望立即得到答案。此外,快速的token生成速度在智能体工作流程中变得尤为重要,有时甚至比模型的质量更加关键。他强调,通往AGI(人工通用智能)是一个旅程而非终点,智能体工作流程的出现让我们向这个目标又迈进了一步。通过智能体工作流程,我们不仅能够提升现有AI模型的性能,还能够探索AI的新可能性。随着这一理念的普及和技术的发展,智能体工作流程有望成为推动AI领域前进的主流方向。
本文链接:https://houze.cc/gpt5/53.html
网友评论