Agentic workflow加速Agentic AI到來(lái),AI Agent成為重要實(shí)現(xiàn)方式
OpenAI定義大模型時(shí)代AI Agent,吳恩達(dá)揭開生成式Agentic AI序幕
還在討論AI Agent嗎?從Agentic Workflow開始該關(guān)注Agentic AI了
從AI Agent審美疲勞到Agentic AI引人熱議,Agentic Workflow真正火了
什么是Agentic AI?與AI Agent有什么區(qū)別和聯(lián)系?一篇文章看明白
握準(zhǔn)大模型時(shí)代商業(yè)脈搏:戰(zhàn)略層瞄準(zhǔn)Agentic AI,戰(zhàn)術(shù)層鎖定AI Agent
文/王吉偉
就在國(guó)內(nèi)還在大談特談AI Agent的時(shí)候,國(guó)外技術(shù)圈的風(fēng)向變了。他們不再談?wù)揂I Agent如何如何,而是轉(zhuǎn)頭開始交流Agentic AI。
雖然Agentic AI的概念可以追溯到上世紀(jì)IBM深藍(lán)象棋系統(tǒng)(Deep Blue chess-playing system)出現(xiàn)的90年代,但讓它再次進(jìn)入公眾視野的卻是大語(yǔ)言模型的真正應(yīng)用。尤其是AI Agent和Autonomous Agent的具體應(yīng)用,讓Autonomous AI再次被熱議,包含AI Agent的工作流更是直接讓Agentic AI成為AI領(lǐng)域更炙手的話題。
這個(gè)進(jìn)程與變化,仍然要感謝OpenAI。2023年6月,OpenAI應(yīng)用研究主管翁麗蓮(Lilian Weng)撰寫了《LLM Powered Autonomous Agents》一文,定義了目前很多開發(fā)者都在用的AI Agent主流技術(shù)框架。
文章地址:https://lilianweng.github.io/posts/2023-06-23-agent
2023年12月,OpenAI發(fā)表《Practices for Governing Agentic AI Systems》白皮書,介紹了Agenticness、Agentic AI Systems及Agents的區(qū)別,并正式為Agentic AI Systems下了定義。自此,Agentic AI 也正式進(jìn)入了技術(shù)人的視野。
白皮書地址:https://openai.com/index/practices-for-governing-agentic-ai-systems/
真正讓Agentic AI出圈的,還是人工智能領(lǐng)域領(lǐng)軍人物、DeepLearning.AI與Landing AI創(chuàng)始人兼CEO吳恩達(dá)教授提出的Agentic Workflow。2024年3月26日,吳恩達(dá)教授在紅杉資本(Sequoia Capital)的人工智能峰會(huì)(AI Ascent)上發(fā)表了一次主題為《Agentic Reasoning》的演講,分享了當(dāng)下AI Agent的4種主流設(shè)計(jì)模式。
在最近的2024年Snowflake峰會(huì)開發(fā)者日上,他又發(fā)表了題為《How Al Agentic workflows could drive more Al progress than even the next generation of foundation models》的演講,進(jìn)一步揭開了Agentic AI神秘面紗,并指它可能是比下一代基礎(chǔ)模型更具潛力的AI 展方向。
兩次演講,讓Agentic AI真正成為技術(shù)人所熱衷探討的話題。
AI Agent與Agentic AI 看起來(lái)非常相似,以至于看起來(lái)就像是將“AI Agent”的兩個(gè)單詞互換位置,一般人甚至看不出什么區(qū)別。但若細(xì)細(xì)品味,僅從單詞性質(zhì)名詞與形容詞的區(qū)別上,就能體會(huì)到Agent與Agentic些許不同。而作為人工智能的概念或者技術(shù)名詞,兩者所代表的意義區(qū)別還是非常明顯的。
那么,到底什么是Agentic AI?它有哪些創(chuàng)新與特性?與AI Agent有什么區(qū)別?什么又是Agentic Workflow?有哪些特征?它的四種主流設(shè)計(jì)模式又是什么?本文,從Agentic AI到Agentic Workflow,王吉偉頻道一次為大家說(shuō)清楚。
(注:本文提到的相關(guān)論文、白皮書等資源已打包,后臺(tái)發(fā)消息 agentic 獲取。)
什么是Agentic AI?
在《Practices for Governing Agentic AI Systems》白皮書中,OpenAI認(rèn)為(Agentic AI systems)智能體人工智能系統(tǒng)的特征是能夠采取行動(dòng),這些行動(dòng)在很長(zhǎng)一段時(shí)間內(nèi)持續(xù)地有助于實(shí)現(xiàn)目標(biāo),而不必事先明確規(guī)定其行為。
白皮書將系統(tǒng)的智能性(Agenticness,還可以翻譯為主動(dòng)性\代理性\能動(dòng)性)程度定義為系統(tǒng)在有限的直接監(jiān)督下適應(yīng)性地實(shí)現(xiàn)復(fù)雜環(huán)境中的復(fù)雜目標(biāo)的程度,并將這種智能性細(xì)分為目標(biāo)復(fù)雜性、環(huán)境復(fù)雜性、適應(yīng)性和獨(dú)立執(zhí)行四個(gè)組成部分。
▲ OpenAI定義的Agentic AI Systems,來(lái)源:《Practices for Governing Agentic AI Systems》
artificiality將Agentic AI Systems定義為能夠以不同復(fù)雜性感知、推理和行動(dòng)的系統(tǒng),以將人類思維擴(kuò)展到我們當(dāng)前經(jīng)驗(yàn)之外。該定義,更加強(qiáng)調(diào)了感知、推理和行動(dòng)這三種能力。
基于以上兩個(gè)Agentic AI Systems定義,結(jié)合業(yè)界對(duì)于Agentic AI的各種觀點(diǎn),不難歸納出Agentic AI這一概念所代表的深刻含義。
Agentic AI(智能體AI\代理式AI\能動(dòng)AI),也稱為自主AI(Autonomous AI),是指被設(shè)計(jì)用來(lái)通過(guò)理解目標(biāo)、導(dǎo)航復(fù)雜環(huán)境,并在最少的人工干預(yù)下執(zhí)行任務(wù)的系統(tǒng),能夠通過(guò)自然語(yǔ)言輸入獨(dú)立和主動(dòng)地完成端到端任務(wù)。通常被設(shè)計(jì)為更具自主性和適應(yīng)性,不僅能處理數(shù)據(jù),還做出決策、從互動(dòng)中學(xué)習(xí),并采取積極的步驟來(lái)實(shí)現(xiàn)復(fù)雜目標(biāo)。
Agentic AI可以設(shè)定目標(biāo),從互動(dòng)中學(xué)習(xí),并自主做出決策,轉(zhuǎn)變業(yè)務(wù)運(yùn)營(yíng)和客戶互動(dòng)。功能與人類員工非常相似,可以掌握細(xì)微的環(huán)境,設(shè)定和追求目標(biāo),通過(guò)任務(wù)進(jìn)行推理,并根據(jù)不斷變化的條件調(diào)整他們的行動(dòng)。
例如,雖然傳統(tǒng)AI可能協(xié)助創(chuàng)建客戶支持腳本或甚至根據(jù)客戶輸入生成個(gè)性化響應(yīng),但Agentic AI則更進(jìn)一步。它可以自主處理客戶查詢,從開始到結(jié)束解決問(wèn)題,甚至根據(jù)客戶的回應(yīng)跟進(jìn)客戶。Agentic AI可以模仿人類通常用來(lái)實(shí)現(xiàn)目標(biāo)的推理、執(zhí)行和糾正航向機(jī)制,體現(xiàn)了一種更精細(xì)的技術(shù)運(yùn)作機(jī)制和管理方法。
事實(shí)上,Agentic AI背后的理念是賦予機(jī)器代理權(quán),這意味著它們可以設(shè)定目標(biāo)、規(guī)劃,并采取行動(dòng)來(lái)達(dá)到這些目標(biāo)。Agentic AI能夠預(yù)測(cè)需求、建議行動(dòng),并做出與設(shè)定目標(biāo)一致的決策,其功能更像是一個(gè)合作伙伴而不僅僅是一個(gè)工具。因此,它代表了人工智能的根本轉(zhuǎn)變,旨在以最少的人工干預(yù)自主理解和管理復(fù)雜的工作流程。
Agentic AI的創(chuàng)新與特性
這里,為了體現(xiàn)Agentic AI的創(chuàng)新與特性,需要將其與傳統(tǒng)AI做一下對(duì)比。
傳統(tǒng) AI(Traditional AI),也稱為狹義AI(Narrow AI),主要在特定算法和設(shè)置規(guī)則上運(yùn)行。這些系統(tǒng)旨在執(zhí)行定義明確的任務(wù),例如對(duì)數(shù)據(jù)進(jìn)行排序、識(shí)別照片中的人臉、翻譯語(yǔ)言、執(zhí)行預(yù)定義的流程或基于數(shù)據(jù)庫(kù)回答常見(jiàn)問(wèn)題解答。傳統(tǒng)人工智能的范圍僅限于其編程,缺乏偏離其給定指令或獨(dú)立學(xué)習(xí)新經(jīng)驗(yàn)的能力。
傳統(tǒng)AI擅長(zhǎng)于狹義的任務(wù),需要在明確的指令下運(yùn)行。它能在具有明確規(guī)則的結(jié)構(gòu)化環(huán)境中茁壯成長(zhǎng),并在流程嚴(yán)格劃分的場(chǎng)景中有效運(yùn)作,但會(huì)受到其有限的范圍、對(duì)人類指導(dǎo)的依賴以及難以適應(yīng)不可預(yù)見(jiàn)變化的限制。
此外,傳統(tǒng)AI主要是為了自動(dòng)執(zhí)行特定的重復(fù)性任務(wù),在有限的范圍內(nèi)提高速度和效率,但它們?cè)谔幚硇枰w理解和戰(zhàn)略判斷的復(fù)雜工作流程方面存在不足。
Agentic AI則利用大型語(yǔ)言模型 (LLM)、可擴(kuò)展的計(jì)算能力和龐大的數(shù)據(jù)集等進(jìn)步,提供了一種更加動(dòng)態(tài)和靈活的方法。它結(jié)合了強(qiáng)化學(xué)習(xí)(RL)和決策理論,可以從互動(dòng)中學(xué)習(xí)并隨時(shí)間優(yōu)化。不僅能對(duì)情況做出反應(yīng),而且能積極地參與決策過(guò)程。
可以說(shuō),Agentic AI就是為了自主性而構(gòu)建的,旨在駕馭復(fù)雜的現(xiàn)實(shí)世界場(chǎng)景,并能夠隨著情況的發(fā)展調(diào)整其策略。這標(biāo)志著從AI作為需要人類輸入的工具或?qū)I(yè)系統(tǒng),到作為能夠獨(dú)立行動(dòng)和與現(xiàn)實(shí)世界互動(dòng)的協(xié)作伙伴的深刻轉(zhuǎn)變。
Agentic AI 的功能更像是人類員工,掌握自然語(yǔ)言提供的復(fù)雜上下文和指令,開始設(shè)定目標(biāo),通過(guò)子任務(wù)進(jìn)行推理,并根據(jù)不斷變化的條件調(diào)整決策和行動(dòng)。
因此,Agentic AI的關(guān)鍵創(chuàng)新主要體現(xiàn)于以下幾點(diǎn):
大型語(yǔ)言模型(LLMs):這些模型能夠理解詳細(xì)的人類語(yǔ)言,使人與人之間的互動(dòng)更加自然,使Agentic AI能夠理解細(xì)微的人類語(yǔ)音和文本。
可擴(kuò)展的計(jì)算能力:增強(qiáng)的計(jì)算能力,使Agentic AI能夠管理復(fù)雜的任務(wù)并訓(xùn)練復(fù)雜的模型。
大規(guī)模數(shù)據(jù)集:通過(guò)分析大量的數(shù)據(jù),Agentic AI可以學(xué)習(xí)和隨著時(shí)間的推移提高其性能,使其更有效地處理動(dòng)態(tài)環(huán)境,豐富的數(shù)據(jù)集也使其能夠理解和解釋復(fù)雜的上下文和目標(biāo)。
互聯(lián)性:Agentic AI擅長(zhǎng)與其他系統(tǒng)和信息源連接及互動(dòng),并能夠無(wú)縫集成到現(xiàn)有的工作流程中,增強(qiáng)了其解決復(fù)雜問(wèn)題和做出復(fù)雜決策的能力。
Agentic AI的主要特性,也可以總結(jié)為:
自治性:Agentic AI以高度獨(dú)立性運(yùn)作。擁有明確的目標(biāo)和對(duì)周圍環(huán)境不斷演變的理解,這些系統(tǒng)能夠自主做出決策并啟動(dòng)行動(dòng),最小化對(duì)直接人類監(jiān)督的依賴。
適應(yīng)性:與它們的前身不同,Agentic AI系統(tǒng)不僵硬或脆弱。它們被設(shè)計(jì)為學(xué)習(xí)、進(jìn)化和適應(yīng)。它們通過(guò)分析模式、根據(jù)變化調(diào)整策略以及通過(guò)模擬和自省來(lái)完善決策過(guò)程,展現(xiàn)出無(wú)與倫比的靈活性。
主動(dòng)性:Agentic AI不僅對(duì)外部刺激做出反應(yīng),還能主動(dòng)與環(huán)境互動(dòng),尋找實(shí)現(xiàn)目標(biāo)的機(jī)會(huì),在潛在問(wèn)題完全顯現(xiàn)之前預(yù)測(cè)它們,并獨(dú)立設(shè)計(jì)解決方案。
語(yǔ)言理解:憑借解釋自然語(yǔ)言的高級(jí)能力,這些系統(tǒng)可以精確地遵循復(fù)雜的指令。
工作流程優(yōu)化:Agentic AI可在子任務(wù)和應(yīng)用程序之間高效轉(zhuǎn)換,確保以最佳方式執(zhí)行流程以實(shí)現(xiàn)預(yù)期結(jié)果。
現(xiàn)在,像CrewAI、Langraph及Autogen等開創(chuàng)性框架,正在為Agentic AI的發(fā)展鋪平道路。開發(fā)人員可以在這些平臺(tái)設(shè)計(jì)和部署AI Agent團(tuán)隊(duì),每個(gè)Agent都有獨(dú)特的技能、知識(shí)庫(kù)和通信界面。通過(guò)協(xié)調(diào)協(xié)作,這些Agent團(tuán)隊(duì)可以自主導(dǎo)航和執(zhí)行復(fù)雜的工作流程,適應(yīng)動(dòng)態(tài)條件和不斷變化的需求。
擴(kuò)展閱讀:AI智能體構(gòu)建智能未來(lái),全球80+AI Agent構(gòu)建平臺(tái)大盤點(diǎn)
這些進(jìn)步,使Agentic AI能夠超越僅僅遵循指令來(lái)設(shè)定獨(dú)立目標(biāo)、制定戰(zhàn)略和適應(yīng),從而為實(shí)現(xiàn)復(fù)雜目標(biāo)提供動(dòng)態(tài)方法。
Agentic AI與AI Agent的區(qū)別
雖然AI Agent這個(gè)詞組與Agentic AI長(zhǎng)的很像,基本就是“AI在后”與“AI在前”的區(qū)別,但兩個(gè)概念還是有很大區(qū)別的。
對(duì)于Agent和Agentic這兩個(gè)單詞,吳恩達(dá)教授在文章中提到:與其以二元方式選擇某個(gè)系統(tǒng)是否是Agent,不如將系統(tǒng)視為具有不同程度的Agent特性更有用。與名詞“Agent”不同,形容詞“Agentic”允許我們思考這類系統(tǒng),并將它們?nèi)考{入這一不斷發(fā)展的領(lǐng)域中。
原文:Rather than having to choose whether or not something is an agent in a binary way, I thought, it would be more useful to think of systems as being agent-like to different degrees. Unlike the noun “agent,” the adjective “agentic” allows us to contemplate such systems and include all of them in this growing movement.
原文鏈接:
https://www.deeplearning.ai/the-batch/welcoming-diverse-approaches-keeps-machine-learning-strong
也就是說(shuō),名詞“Agent”僅用于表明某個(gè)產(chǎn)品或項(xiàng)目是否為AI Agent是否具備了智能特性,而形容詞“Agentic”則意味著AI產(chǎn)品或項(xiàng)目的Agentic特性有多強(qiáng)能否體現(xiàn)更強(qiáng)大主動(dòng)性、自治性和適應(yīng)性。前者仍在探討Agent產(chǎn)品或項(xiàng)目的相關(guān)特性,后者則在探討產(chǎn)品的智能程度,顯然后者更有意義。
從AI Agent到Agentic AI,即使當(dāng)前所探討的內(nèi)容仍是AI Agent相關(guān)的技術(shù)、產(chǎn)品或解決方案,但立足點(diǎn)已經(jīng)截然不同,這是一個(gè)認(rèn)知上的重大轉(zhuǎn)變。如果說(shuō)AI Agent仍然屬于產(chǎn)品思維,Agentic AI已經(jīng)上升到戰(zhàn)略思維。Agentic AI進(jìn)一步代表了一類AI技術(shù)、產(chǎn)品、方案、生態(tài)乃至戰(zhàn)略的總體集合,必然也會(huì)像GenAI等詞匯一樣被更多的組織放到其戰(zhàn)略報(bào)告之中。
從定義和概念而言,AI Agent是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。它們通常基于機(jī)器學(xué)習(xí)和人工智能技術(shù),具備自主性和自適應(yīng)性,在特定任務(wù)或領(lǐng)域中能夠自主地進(jìn)行學(xué)習(xí)和改進(jìn)。其核心功能可以歸納為三個(gè)步驟的循環(huán):感知、規(guī)劃和行動(dòng)。
Agentic AI是具有更高程度自主性的AI系統(tǒng),它們能夠主動(dòng)思考、規(guī)劃和執(zhí)行任務(wù),而不僅僅依賴于預(yù)設(shè)的指令。它強(qiáng)調(diào)的是系統(tǒng)可以具有不同程度的“能動(dòng)性”(Agentic特性),而不僅僅局限于被動(dòng)執(zhí)行指令。
兩者的主要區(qū)別,主要在于以下幾點(diǎn):
AI Agent更側(cè)重于智能實(shí)體的基本功能和自主性,而Agentic AI則強(qiáng)調(diào)系統(tǒng)在更高層面上的自主決策和問(wèn)題解決能力。
AI Agent可以看作是實(shí)現(xiàn)Agentic AI的一種技術(shù)手段或組件,而Agentic AI則是AI Agent在特定工作流程和目標(biāo)導(dǎo)向下的一種表現(xiàn)形式。
Agentic AI的概念更寬泛,涵蓋了從傳統(tǒng)AI系統(tǒng)到高度自主智能體的一系列發(fā)展階段,而AI Agent通常指的是具備一定感知、決策和行動(dòng)能力的智能實(shí)體。
對(duì)于兩者的區(qū)別,我們說(shuō)了這么多。但當(dāng)探索Agentic AI的時(shí)候,你會(huì)發(fā)現(xiàn)更多內(nèi)容仍舊是AI Agent相關(guān)的,或者說(shuō)是“Agent+工作流”相關(guān)的。吳恩達(dá)教授也提到,Agentic AI的實(shí)現(xiàn)關(guān)鍵在于“智能體工作流(Agentic Workflow)”,它通過(guò)循環(huán)迭代的方式逐步優(yōu)化結(jié)果,更接近于人類解決問(wèn)題的思維模式。
因此,如果說(shuō)Agentic AI聚焦的是戰(zhàn)略層面指向組織技術(shù)發(fā)展目標(biāo),AI Agent則正是在戰(zhàn)術(shù)層面實(shí)現(xiàn)這個(gè)目標(biāo)的主要方法。
既然涉及到了Agentic Workflow這一概念,這里也來(lái)聊一聊。
什么是Agentic Workflow?
自從吳恩達(dá)教授分享了Agentic workflow的四種設(shè)計(jì)方法之后,Agentic workflow變得越發(fā)炙手可熱。雖然這個(gè)概念并不是全新的,但在大語(yǔ)言模型和AI Agent應(yīng)用日益壯大的情況下,Agentic Workflow也正在變得炙手可熱。
匯總各方人士的觀點(diǎn)與看法之后,可以對(duì)Agentic Workflow做出以下解釋。
Agentic Workflow可以翻譯為智能體工作流\代理工作流\能動(dòng)工作流,核心是一個(gè)智能體系統(tǒng),其中多個(gè)AI Agent通過(guò)利用自然語(yǔ)言處理 (NLP) 和大型語(yǔ)言模型 (LLM) 協(xié)作完成任務(wù)。這些智能體能夠自主感知、推理和行動(dòng),以追求特定目標(biāo),形成強(qiáng)大的集體智慧,可以打破孤島,集成不同的數(shù)據(jù)源,并提供無(wú)縫的端到端自動(dòng)化。
作為一個(gè)復(fù)雜的系統(tǒng)和迭代過(guò)程,Agentic Workflow旨在提高業(yè)務(wù)流程的效率和有效性。它使用AI Agent與業(yè)務(wù)設(shè)置無(wú)縫集成,部署在Agentic Workflow中的AI Agent能夠高精度地協(xié)作和執(zhí)行復(fù)雜任務(wù)。
Agentic workflow架構(gòu)圖 來(lái)源:codiste
從開發(fā)角度而言,Agentic Workflow是指一種迭代、交互式的AI開發(fā)方法,使用大型語(yǔ)言模型和AI Agent來(lái)執(zhí)行任務(wù),其中AI Agent能夠參與更動(dòng)態(tài)和自我反思的過(guò)程,這是一種更迭代和多步驟的方法。
從自動(dòng)化角度來(lái)看,Agentic Workflow代表了傳統(tǒng)自動(dòng)化方法的重大轉(zhuǎn)變。傳統(tǒng)自動(dòng)化方法通常依賴于嚴(yán)格的預(yù)定義腳本或人機(jī)交互流程,通過(guò)利用多個(gè)專業(yè)AI Agent協(xié)同工作的能力,Agentic系統(tǒng)可以動(dòng)態(tài)導(dǎo)航和適應(yīng)企業(yè)工作流程的復(fù)雜性,因此有望將各行各業(yè)的生產(chǎn)力和創(chuàng)新提升到新的水平。
簡(jiǎn)單來(lái)說(shuō),Agentic Workflow是一個(gè)復(fù)雜的迭代和多步驟過(guò)程,用于交互和指示大型語(yǔ)言模型,以更準(zhǔn)確地完成復(fù)雜的任務(wù)。在此過(guò)程中,單個(gè)任務(wù)被劃分為多個(gè)更易于管理的小任務(wù),并在整個(gè)任務(wù)完成過(guò)程中留出改進(jìn)空間。
此外,Agentic Workflow還涉及部署多個(gè)AI Agent來(lái)執(zhí)行特定的角色和任務(wù)。這些Agent配備了特定的個(gè)性和屬性,使他們能夠高精度地協(xié)作和執(zhí)行定義的任務(wù)。
Agentic Workflow的另一個(gè)關(guān)鍵亮點(diǎn)是使用先進(jìn)的提示工程技術(shù)和框架。該過(guò)程包括思維鏈、計(jì)劃和自我反思等技術(shù),使AI Agent能夠:
將復(fù)雜的任務(wù)分解為可管理的任務(wù);
確定任務(wù)順序;
遇到困難時(shí)調(diào)整任務(wù)計(jì)劃;
自我反思自己的產(chǎn)出并確定需要改進(jìn)的領(lǐng)域;
提示的工程技術(shù)和多智能體方法使AI Agent能夠自主計(jì)劃、協(xié)作、確定和執(zhí)行完成任務(wù)的必要步驟。
舉個(gè)例子,如果你直接使用LLM寫一篇關(guān)于Agentic AI的文章。在傳統(tǒng)方法中,需要輸入一個(gè)提示,指示LLM 撰寫這個(gè)主題的文章。這就像要求某人從頭到尾寫文章,不審查研究來(lái)源、檢查大綱并改善內(nèi)容的語(yǔ)氣和質(zhì)量。
這種傳統(tǒng)的零樣本方法使用LLM,在撰寫文章的過(guò)程中沒(méi)有留下迭代、反饋和改進(jìn)的余地,大大降低了輸出的準(zhǔn)確性和質(zhì)量。
但在Agentic Workflow并不需要給出撰寫文章的提示,僅需要提出目標(biāo)要求,它就能將任務(wù)分解為更小的任務(wù),一般會(huì)有如下的任務(wù)分解步驟:
首先從可靠的來(lái)源研究該主題;
創(chuàng)建帶有標(biāo)題和副標(biāo)題的博客大綱;
分析、修改和改進(jìn)大綱;
撰寫博客初稿;
校對(duì)和編輯博客以確保高內(nèi)容質(zhì)量
在Agentic Workflow工作模式下,LLM被指示按照一個(gè)循序漸進(jìn)的過(guò)程完成更大的任務(wù),且每個(gè)步驟的輸出充當(dāng)下一個(gè)任務(wù)的輸入。
這意味著,Agentic Workflow這種迭代和協(xié)作模型,將與LLM 的交互轉(zhuǎn)換為一系列可管理、可改進(jìn)的步驟,從而允許在整個(gè)任務(wù)完成過(guò)程中進(jìn)行持續(xù)改進(jìn)和調(diào)整。
Agentic Workflow的主要特征與三大支柱
通過(guò)以上解析和案例,我們可以總結(jié)Agentic Workflow的主要特征如下:
以目標(biāo)為導(dǎo)向:工作流中的座席由明確的目標(biāo)驅(qū)動(dòng),并共同努力實(shí)現(xiàn)預(yù)期的結(jié)果。
適應(yīng)性:該系統(tǒng)可以動(dòng)態(tài)地適應(yīng)不斷變化的環(huán)境,從過(guò)去的經(jīng)驗(yàn)中學(xué)習(xí),并隨著時(shí)間的推移優(yōu)化其性能。
互動(dòng):座席相互通信和協(xié)作,以及與人類用戶進(jìn)行通信和協(xié)作,以收集信息、提供更新并做出決策。
與傳統(tǒng)工作流自動(dòng)化相比,Agentic Workflow具有多種優(yōu)勢(shì)。它們可以處理更復(fù)雜的多步驟流程,這些流程需要上下文感知決策,并且可以適應(yīng)新情況,而無(wú)需大量重新編程。此外,自然語(yǔ)言處理的使用允許人與系統(tǒng)之間更直觀地交互,從而減少對(duì)專業(yè)技術(shù)知識(shí)的需求。
在Agentic Workflow中,AI Agent是一個(gè)自主驅(qū)動(dòng)的動(dòng)態(tài)問(wèn)題解決器,用于處理復(fù)雜且不斷發(fā)展的任務(wù),從而提高工作效率。
AI Agents、提示工程技術(shù)(Prompt Engineering Techniques)和生成式AI網(wǎng)絡(luò)(Generative AI Networks,GAIN) 是Agentic Workflow的三大支柱。它們?cè)贏gentic Workflow中的作用,簡(jiǎn)單介紹如下:
AI Agent:Agentic Workflow的核心是AI Agent,它們本質(zhì)上是大型語(yǔ)言模型(LLMs)的復(fù)雜實(shí)例。
提示工程技術(shù)與框架:Agentic Workflow的一個(gè)關(guān)鍵方面是使用高級(jí)提示工程技術(shù)和框架。
生成式AI網(wǎng)絡(luò)(GAINs):通過(guò)部署生成式AI網(wǎng)絡(luò)(GAINs),Agentic Workflow得到顯著增強(qiáng),它們體現(xiàn)了多代理協(xié)作的原則。
三大支柱的詳細(xì)內(nèi)容,可以參考下面的思維導(dǎo)圖。
▲ 點(diǎn)擊看大圖
除了三大支柱,Agentic Workflow的核心組成部分還包括AI增強(qiáng)、倫理考量、人工智能交互和適應(yīng)性學(xué)習(xí),各項(xiàng)解析如下圖。
此外,關(guān)于Agentic Workflow的常見(jiàn)工作流程及可重用的LLM配置文件組件,大家可以參考論文:A Survey on LLM-Based Agents: Common Workflows and Reusable LLM-Profiled Components.
論文地址:
https://arxiv.org/abs/2406.05804
各種工作的業(yè)務(wù)流程從傳統(tǒng)流程轉(zhuǎn)向Agentic Workflow,標(biāo)志著我們將能夠通過(guò)AI實(shí)現(xiàn)更優(yōu)越成果的轉(zhuǎn)變。實(shí)驗(yàn)證明,即便是不太先進(jìn)的LLMs,參與這些復(fù)雜的、多層次的工作流程時(shí),也能產(chǎn)生顯著的成果。對(duì)于這一點(diǎn),大家將在下面對(duì)Agentic Workflow的四種設(shè)計(jì)模式的介紹中有更深的感觸。
多說(shuō)一句,Agentic Workflow也讓國(guó)產(chǎn)大語(yǔ)言模型和各種開源大語(yǔ)言模型擁有了更多用武之地,這在當(dāng)前的國(guó)際大環(huán)境下還是非常重要的。
當(dāng)然,我們還應(yīng)該認(rèn)識(shí)到,在目前的技術(shù)前提下,這些增強(qiáng)的工作流程要求用戶有足夠的耐心。因?yàn)锳gentic Workflow固有的迭代、協(xié)作過(guò)程也更加耗時(shí),往往需要幾分鐘甚至幾小時(shí)來(lái)完成某個(gè)任務(wù)。過(guò)長(zhǎng)的任務(wù)執(zhí)行時(shí)間,也是Agentic Workflow遇到的主要問(wèn)題之一,更是被吐槽體驗(yàn)不夠的重要因素。
但相對(duì)于它能提供的遠(yuǎn)超過(guò)傳統(tǒng)方法的分析深度、創(chuàng)造力和解決問(wèn)題的能力,在很多應(yīng)用場(chǎng)景中大家仍然愿意嘗試,這也預(yù)示著巨大的市場(chǎng)潛力。
Agentic Workflow的四種主流設(shè)計(jì)模式
在介紹Agentic Workflow之前,先考慮一個(gè)問(wèn)題,為什么需要AI Agent/Agentic Workflow?
目前,對(duì)于ChatGPT、文心一言、Kimi等大語(yǔ)言模型的使用,大多數(shù)人仍然是用簡(jiǎn)單的語(yǔ)句直接提問(wèn)(一部分原因在于不會(huì)寫結(jié)構(gòu)化提示詞),比如:幫我寫一篇關(guān)于Agentic AI的文章。這種提問(wèn)方式,在技術(shù)領(lǐng)域叫作零樣本提示。
零樣本提示(zero-shot prompting)是指LLM模型在沒(méi)有針對(duì)具體任務(wù)進(jìn)行專門訓(xùn)練的情況下,僅依賴于提示詞(prompt)和預(yù)訓(xùn)練中獲得的廣泛語(yǔ)言知識(shí)來(lái)執(zhí)行任務(wù)的能力,它可以很好地檢驗(yàn)大語(yǔ)言模型的能力。這種方法靈活性高、適用范圍廣,且無(wú)需為每個(gè)特定任務(wù)準(zhǔn)備專門的訓(xùn)練數(shù)據(jù)。但由于缺乏特定任務(wù)的訓(xùn)練,其生成質(zhì)量無(wú)法保證。
具體到用戶與大語(yǔ)言模型的交互,如果用戶讓ChatGPT寫一篇關(guān)于XX的論文,ChatGPT會(huì)一次性給出回復(fù)。在這個(gè)過(guò)程中,它只會(huì)執(zhí)行“生成”這個(gè)任務(wù)。
這個(gè)過(guò)程,與真實(shí)世界完成工作任務(wù)的流程是不同的。比如寫論文時(shí),一般會(huì)先起草一個(gè)初稿,再進(jìn)行評(píng)估、分析、修訂,迭代出第二、第三個(gè)版本,直到滿意為止。我們處理工作、學(xué)習(xí)等任務(wù)時(shí)都是這樣,會(huì)將其分解為按步執(zhí)行的流程并按照流程來(lái)操作,以保證工作的完成的質(zhì)量。
▲ 零樣本提示與Agentic Workflow的區(qū)別 來(lái)源:吳恩達(dá)教授紅杉峰會(huì)分享
也就是說(shuō),想要讓大語(yǔ)言模型更出色的完成我們的交給它的工作,最好也使用類似人類的分部執(zhí)行的流程步驟。
AI Agent就是來(lái)做這個(gè)工作的,它能通過(guò)自然語(yǔ)言了解用戶所輸入零樣本提示詞的意圖,并將這個(gè)用戶給定的需求目標(biāo)任務(wù)規(guī)劃分解為多個(gè)流程步驟,將簡(jiǎn)單的提示詞轉(zhuǎn)化為更精細(xì)的機(jī)構(gòu)化提示詞,并可以調(diào)用聯(lián)網(wǎng)、代碼等各種工具插件去進(jìn)一步執(zhí)行并完成所分解的各種子任務(wù)。
顯然,這樣的工作方式已經(jīng)無(wú)限接近于人類。
Zero-shot prompting模式和AI Agent模式的任務(wù)執(zhí)行效果,非常明顯。吳恩達(dá)教授團(tuán)隊(duì)分別以“Zero-shot prompting”模式和AI Agent模式使用GPT-3.5和GPT-4,得出了幾個(gè)結(jié)論:
1、Zero-shot模式下,模型在沒(méi)有具體任務(wù)示例的情況下,僅依賴于其預(yù)訓(xùn)練的知識(shí)來(lái)執(zhí)行任務(wù)。這種情況下比拼的是模型的通用基礎(chǔ)能力,所以GPT-4得表現(xiàn)好在意料之中。
2、添加了Agentic Workflow的AI Agent在任務(wù)執(zhí)行中的表現(xiàn)顯著提升,不論基座模型是GPT-3.5還是GPT-4。
3、即使基座模型是GPT-3.5,通過(guò)添加Agentic Workflow將其設(shè)計(jì)為AI Agent后,性能表現(xiàn)也超過(guò)了Zero-shot模式下的GPT-4。
吳恩達(dá)教授還總結(jié)和介紹了四種較為常見(jiàn)的設(shè)計(jì)模式,分別是反饋(Reflection)、工具使用(Tool Use)、規(guī)劃(Planning)和多智能體協(xié)作(Multi-agent Collaboration)。
反饋(Reflection)設(shè)計(jì)模式是一種讓AI模型通過(guò)自我反思和迭代改進(jìn)來(lái)提高任務(wù)執(zhí)行能力的方法。在這種模式中,模型不僅生成初始解決方案,還會(huì)通過(guò)多次反饋和修改,不斷優(yōu)化其輸出。
工具使用(Tool Use)設(shè)計(jì)模式是一種讓AI模型通過(guò)調(diào)用外部工具或庫(kù)來(lái)增強(qiáng)任務(wù)執(zhí)行能力的方法。在這種模式中,模型并不僅僅依賴于自身的知識(shí)和能力,而是利用各種外部資源來(lái)完成任務(wù),從而提高效率和準(zhǔn)確性。
規(guī)劃(Planning)設(shè)計(jì)模式是一種通過(guò)提前計(jì)劃和組織任務(wù)步驟來(lái)提高效率和準(zhǔn)確性的方法。在這種模式中,模型將復(fù)雜任務(wù)分解為多個(gè)步驟,并依次執(zhí)行每個(gè)步驟,以達(dá)到預(yù)期的目標(biāo)。
多智能體協(xié)作(Multiagent Collaboration)設(shè)計(jì)模式是一種通過(guò)多個(gè)智能體之間的合作來(lái)提高任務(wù)執(zhí)行效率和準(zhǔn)確性的方法。在這種模式中,多個(gè)智能體分擔(dān)任務(wù),并通過(guò)相互交流和協(xié)作,共同完成復(fù)雜任務(wù)。
PS:以上標(biāo)有 Andrew Ng的圖片,都來(lái)自吳恩達(dá)教授紅杉峰會(huì)分享。公眾號(hào)后臺(tái)發(fā)消息 agentic ,獲取 吳恩達(dá)紅杉美國(guó)AI峰會(huì)談 Agentic Workflow 以及 4 種主流設(shè)計(jì)模式的PDF文件。
AI Agent/Agentic Workflow可以更好幫助用戶與大語(yǔ)言模型交互,幫助用戶更好的完成各種任務(wù)。這將極大地拓展AI的使用場(chǎng)景,有效地提高任務(wù)完成質(zhì)量,因此對(duì)AI應(yīng)用的落地至關(guān)重要。
在這個(gè)分享中,吳恩達(dá)教授將Agent參與的流程稱作Agentic Workflow,而不是AI Agent workflow,顯然后者更注重AI Agent參與的workflow而不是AI Agent本身。從這一點(diǎn),也能看出AI Agent與 Agentic AI的簡(jiǎn)單區(qū)別。
對(duì)于AI Agent參與的業(yè)務(wù)流程自動(dòng)化,RPA\超自動(dòng)化、ERP、CRM、BI等技術(shù)廠商早已在現(xiàn)有技術(shù)生態(tài)下引入了AI Agent架構(gòu),且表現(xiàn)出的任務(wù)執(zhí)行能力更強(qiáng)。對(duì)于這個(gè)選題,王吉偉頻道會(huì)在另一篇文章中與大家交流。
Agentic AI的概念已經(jīng)講清楚,而后面要實(shí)現(xiàn)這個(gè)目標(biāo)并使其繁榮,就要看各種AI Agent的構(gòu)建方式以及各種融合AI Agent的Agentic Workflow解決方案了。
在Agentic Workflow的構(gòu)建方面,吳恩達(dá)教授給出的四種主流設(shè)計(jì)模式,已經(jīng)給于開發(fā)者及企業(yè)很大啟發(fā)。
目前很多AI Agent構(gòu)建平臺(tái)已經(jīng)支持這四種設(shè)計(jì)模式,企業(yè)及個(gè)人都已能在這些平臺(tái)構(gòu)建符合需求Agentic Workflow。還有很多開源項(xiàng)目也在進(jìn)一步優(yōu)化Agentic workflow的構(gòu)建流程,對(duì)于廣大組織的私有化部署都是極大的利好。
此外很多技術(shù)供應(yīng)商也已在引入AI Agent的基礎(chǔ)上進(jìn)一步構(gòu)建Agentic Workflow,能夠讓用戶更簡(jiǎn)單快捷的應(yīng)用各種智能工作流。
在Agentic Workflow構(gòu)建上,王吉偉頻道也會(huì)在后面寫幾篇文章與大家分享相關(guān)的體驗(yàn)感受。大家想在哪些方面進(jìn)行交流,歡迎踴躍留言。
后記:握住Agentic AI的商業(yè)脈搏
當(dāng)前AI應(yīng)用有一個(gè)大趨勢(shì),幾乎所有應(yīng)用都在向AI Agent和RAG的方向發(fā)展與遷移。這意味著,如果所有的AI應(yīng)用都走向AI Agent模式,未來(lái)的workflow都將變成Agentic Workflow。
從吳恩達(dá)教授的Zero-shot prompting與Agentic Workflow來(lái)看,任何加持了Agentic模式的大語(yǔ)言模型都能領(lǐng)先大模型本身很多,這意味著接下來(lái)組織與企業(yè)的業(yè)務(wù)流程效率將會(huì)翻倍提升。
在王吉偉頻道看來(lái),即使ChatGPT背后的大語(yǔ)言模型迭代到GPT-4以后的更高版本,Agentic AI也會(huì)是更高效的大語(yǔ)言模型使用方式。不然,OpenAI也不會(huì)發(fā)表本文開頭所提到的白皮書,來(lái)詳細(xì)闡述大語(yǔ)言模型、AI Agent與Agentic AI Systerm的關(guān)聯(lián)與區(qū)別了。
通過(guò)各種系統(tǒng)與集成大語(yǔ)言模型,或者在大語(yǔ)言模型的基礎(chǔ)上做工具與平臺(tái)擴(kuò)展,對(duì)于大語(yǔ)言模型的應(yīng)用效率及體驗(yàn)會(huì)更高,已是被驗(yàn)證的事實(shí)。
拓展閱讀:更多組織接入ChatGPT等生成式AI,生成式自動(dòng)化或成企業(yè)運(yùn)營(yíng)新標(biāo)配
從AI技術(shù)發(fā)展歷史來(lái)看,智能體的理念要先于AI,且一直以來(lái)AI都是作為Agent的技術(shù)實(shí)現(xiàn)路徑,大語(yǔ)言模型亦不例外。因此在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)火爆以后,大家都在關(guān)注的是AlphaGo和AI換臉技術(shù)?,F(xiàn)在大語(yǔ)言模型火了,人們關(guān)注更多的也是AI Agent、Agentic Workflow以及接下來(lái)的Agentic AI。
拓展閱讀:AI Agent發(fā)展簡(jiǎn)史,從哲學(xué)思想啟蒙到人工智能實(shí)體落地
當(dāng)然,Agentic AI也不是玄之又玄的東西,只是把AI Agent以及Agentic Workflow在內(nèi)的各種應(yīng)用與生態(tài)歸納成了一類。但不可否認(rèn)的是,它勢(shì)必會(huì)在未來(lái)很長(zhǎng)一段時(shí)間內(nèi)成為各大組織與商業(yè)領(lǐng)域的口頭禪,也會(huì)成為這一階段AI的重要體現(xiàn)形式。
當(dāng)下,全民皆談智能體讓AI Agent越發(fā)審美疲勞,國(guó)外更多則在談Agentic AI。就連吳恩達(dá)教授也在文章中提到:當(dāng)看到一篇談?wù)?ldquo;Agentic”工作流程的文章時(shí),更有可能閱讀。
大家的眼球開始被Agentic AI吸引,是否還會(huì)足夠關(guān)注AI Agent?這是否意味著AI Agent已然勢(shì)微?對(duì)于這些問(wèn)題,大家不要忘了前面我們的探討:AI Agent是Agentic AI的實(shí)現(xiàn)方式,Agentic Workflow是Agentic AI的關(guān)鍵。
所以,從“道”的層面關(guān)注Agentic AI戰(zhàn)略發(fā)展趨勢(shì),從術(shù)的層面關(guān)注AI Agent不斷推陳出新的各種框架、技術(shù)與解決方案,你將會(huì)把握住整個(gè)Agentic AI乃至AGI時(shí)代的商業(yè)脈搏。
全文完
【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動(dòng)化與RPA,歡迎關(guān)注與交流?!?/p>
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
文/道哥美國(guó)設(shè)計(jì)軟件公司Figma近期在紐約證券交易所掛牌上市,首日即上演“狂飆”行情——發(fā)行價(jià)定每股33美元,開盤報(bào)價(jià)85美元,較發(fā)行價(jià)翻倍。首日收?qǐng)?bào)115.50美元,較發(fā)行價(jià)大漲約250%,市值飆升至近670億美元,創(chuàng)下近30年來(lái)同等規(guī)模美股IPO的最大單日漲幅紀(jì)錄。然而,隨著短線資金獲利了結(jié),
8月16日,盧松松非常榮幸的成為了一名《2025世界人形機(jī)器人運(yùn)動(dòng)會(huì)》的觀眾。這是一場(chǎng)超酷的機(jī)器人運(yùn)動(dòng)會(huì),也是人類給機(jī)器人辦的第一屆奧運(yùn)會(huì),來(lái)自16個(gè)國(guó)家的280支隊(duì)伍會(huì)參加500多個(gè)比賽項(xiàng)目。看了一天的比賽,晚上就回來(lái)寫文章,編輯短視頻。先說(shuō)感悟:(1)這是人類首次給機(jī)器人辦的第一屆運(yùn)動(dòng)會(huì),史無(wú)前
文/一燈來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)在當(dāng)前無(wú)人敢缺席的AI軍備競(jìng)賽中,巨頭們一面為巨額的資本支出焦慮,一面又向市場(chǎng)勾勒著未來(lái)的宏偉藍(lán)圖。在各家動(dòng)輒千億級(jí)投入的背景下,市場(chǎng)迫切需要一份關(guān)于AI回報(bào)價(jià)值的有力證明。而騰訊,率先給出了答卷。8月13日,騰訊控股發(fā)布2025年第二季度財(cái)報(bào)。盡管資本開支同比劇增119%,達(dá)
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)2025年的硅谷,一場(chǎng)沒(méi)有硝煙的戰(zhàn)爭(zhēng)正以前所未有的烈度上演。這場(chǎng)戰(zhàn)爭(zhēng)的核心武器不是代碼或芯片,而是人——那些全球僅有數(shù)千名、能夠構(gòu)建未來(lái)人工智能基礎(chǔ)模型的頂尖大腦。在這場(chǎng)激烈的人才爭(zhēng)奪戰(zhàn)中,Meta及其首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)正扮演著最具侵略性的
阿里媽媽、巨量引擎、騰訊廣告,誰(shuí)是當(dāng)代“AI印鈔機(jī)”?
Manus撕開一道真相
文/八真來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)具身智能賽道,誰(shuí)最有可能拔得A股資本市場(chǎng)的頭籌?答案大概率是誕生剛剛兩年,由華為"天才少年"、B站百萬(wàn)粉絲科技UP主稚暉君(彭志輝)創(chuàng)立的智元機(jī)器人。近期,從事新材料研發(fā)與生產(chǎn)的上緯新材(688585.SH)丟出重磅炸彈,宣布智元機(jī)器人及相關(guān)主體將通過(guò)收購(gòu)其至少63.62%的股
文/道哥大舉裁員、清空賬號(hào)、國(guó)內(nèi)IP無(wú)法訪問(wèn)——曾被譽(yù)為“中國(guó)AIAgent希望之星”的Manus,在估值飆至5億美元的高光時(shí)刻“閃離”中國(guó)市場(chǎng)。近日,Manus“裁員、出走”的消息在媒體端大量發(fā)酵。消息稱,Manus公司總部將由中國(guó)遷至新加坡,其國(guó)內(nèi)團(tuán)隊(duì)也將大幅裁撤——原有120人規(guī)模團(tuán)隊(duì)除40余