OpenAI 内部力推,AI 代理真能成为互联网应用发展的下一个阶段吗?
图片来源:由无界 AI 生成
互联网应用的发展历史可以被看作是一个不断演化和创新的过程,随着技术的不断进步,不断有创新的互联网应用的出现。
互联网应用的发展主要可以划分为三个阶段:
1.网站应用(Websites)
1990年代,随着互联网的普及,出现了一些重要的互联网公司,如亚马逊、雅虎、谷歌等,这些公司开发出了一些重要的互联网应用,如电子商务、搜索引擎、在线广告等。
2.移动应用(Mobile)
2000年代,随着移动互联网的兴起,出现了一些重要的移动应用,如智能手机、移动应用商店等。
3.AI代理应用
2020年代,随着 AI 技术的发展,出现了一些重要的人工智能应用,如语音识别、图像识别、自然语言处理等。尤其是 OpenAI 推出 ChatGPT 之后,由大语言模型(LLM)推动的自主 AI 代理应用将会使 AI 代理应用走向新的发展阶段。
AI代理发展版图
图片来源:e2b
什么是 AI 代理
AI代理(AI agent)是指使用 AI 技术设计和编程的一种计算机程序,其可以独立地进行某些任务并对环境做出反应。AI代理可以被视为一个智能体,它能够感知其环境,通过自己的决策和行动来改变环境,并通过学习和适应来提高其性能。这种智能体同时使用短期记忆(上下文学习)和长期记忆(从外部向量存储中检索信息),有能力通过逐步“思考”来计划、将目标分解为更小的任务 ,并反思自己的表现。
AI代理通常包含多种技术,如机器学习、自然语言处理、计算机视觉、规划和推理等,这些技术使代理能够自主地处理信息并作出决策。
OpenAI已经多次表达了对 AI 代理的热衷。OpenAI 联合创始人 Andrej Karpathy 近日在一场开发者线下活动中表示,如果一篇论文提出了某种不同的模型训练方法,OpenAI 内部都会嗤之以鼻,认为都是他们玩剩下的。但是当新的 AI Agents论文出来的时候,他们会认真兴奋的讨论。
什么是 LLM 支持的自主代理
OpenAI AI应用研究主管 Lilian Weng 最近发布了一篇关于 AI 代理的万字长文:《大语言模型(LLM)支持的自主代理》,深度解读了什么是由 LLM 训练构建的 AI 代理应用。LLM 支持的 AI 代理现在已经出现了很多优秀的应用,例如 AutoGPT、GPT-Engineer、BabyAGI 和 SuperAGI 等。
在LLM 支持的自主代理系统中,LLM 充当代理的大脑,并由几个关键组件进行补充:规划(Planning)、内存(Memory)、工具使用(Tool Use)。
这种代理会将大型任务分解为更小的、可管理的子目标,从而能够有效处理复杂的任务。它还可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,从而提高最终结果的质量。
LLM自主代理的一个特别之处在于它就像是拥有“记忆”一样,它能够短期(长期)记住在训练中学习到的东西。此外,LLM 自主带来能够学习调用外部 API 来获取模型权重中缺失的额外信息(通常在预训练后很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。
尽管AI 代理令人兴奋且充满希望,但围绕人工智能代理的炒作仍然存在很多挑战。 AI 代理正在成为软件应用的未来方向,将会变得越来越普遍。
正如Lilian Weng 所说,LLM 自主代理还存在一些常见的限制,包括上下文长度有限、长期规划和任务分解的挑战、LLM 的稳定性等等。
但无需质疑的是,这些问题和挑战都将会被克服或缓解,AI代理已经对我们的工作和生活带来了改变,这种改变是难以被逆转的。尝试过好的东西之后,你还会忍受极差的吗?
参考资料:
https://lilianweng.github.io/posts/2023-06-23-agent/
https://www.blog.e2b.dev/log/ai-agents-in-the-wild
微信扫描关注公众号,及时掌握新动向
2.本文版权归属原作所有,仅代表作者本人观点,不代表比特范的观点或立场
2.本文版权归属原作所有,仅代表作者本人观点,不代表比特范的观点或立场