
Image generated with OpenAI
Vélemény: Miért a mesterséges intelligencia ügynökök a mindennapi mesterséges intelligencia jövője
2025 úgy tűnik, az Agentic AI éve lesz. Az OpenAI, a Microsoft, az Anthropic, és más nagy technológiai cégek kiadták eddigi legfejlettebb AI modelljeiket, amelyek képesek olyan bonyolult feladatok elvégzésére, amelyek még csak tavaly sem voltak lehetségesek. De mi is pontosan az AI ügynökök, és mennyi ebből a technológiából valóság és mennyi csak puszta felhajtás?
Az AI trendek követése az elmúlt években kimerítő lehet. Elindultunk az alapvető AI-tól a generatív AI-en át az érvelő AI-ig, és most az AI ügynökök dominálják a beszélgetést. Az elmúlt hónapokban több technológiai cég is bemutatta új AI ügynökeit és kiemelte, milyen vonzóvá válnak azok a munkafolyamatok, amelyek összekötik őket.
Januárban az OpenAI elindította első AI ügynökét, az Operátort, amely képes önállóan feladatokat végrehajtani, mint például a weben böngészés, étterem foglalás, vagy koncertjegyek beszerzése ön helyett, az ön preferenciái és kritériumai alapján.
Két hónappal később a kínai Zhipu AI startup kiadta az AutoGLM Rumination-t, egy ingyenes AI ügynököt, amely önállóan működik és utazásokat tervez a felhasználóknak. És csak néhány nappal ezelőtt a Microsoft bemutatta a “Számítógép Használatot” a Copilot Studio számára, további autonóm képességeket adva az AI ügynököknek, beleértve a felhasználó asztalának átvételének képességét is.
De ez a trend nem csak arról szól, hogy a vállalatok cool új termékeket dobnak piacra – ez egy összetett és fejlődő terület, amely az AI különböző formáit ötvözi az emberi interakcióval. A technológiai rajongók és szakértők egyaránt nagy optimizmussal tekintenek az Agentic AI-re.
„Az egyik trend, amiért szintén izgatott vagyok, az az AI ügynökök munkafolyamata,” mondta az AI szakértő és a Coursera és DeepLearning társalapítója, Andrew Ng, a Snowflake’s BUILD 2024 konferenciáján novemberben. „Ha megkérdeznéd, melyik a legfontosabb AI technológia, amire figyelni kell? Azt mondanám, hogy ez az Agentic AI.”
Tehát pontosan mik is az AI ügynökök? Olyan jól teljesítenek, ahogy a szakértők állítják? Íme egy rövid áttekintés ennek a felbukkanó technológiának a legfontosabb aspektusairól és a legújabb fejleményekről.
Mik az AI ügynökök?
Ahogy a OpenAI és a Microsoft is bemutatta, az AI ügynökök olyan technológiák, amelyek képesek bonyolult feladatok elvégzésére különböző alkalmazások és szoftverek önálló kombinálásával.
Lényegében ők a “hagyományos” AI chatbotok – de fejlettebbek, képesek olyan feladatokat elvégezni, amikhez az elmúlt két évben még hozzá sem szoktunk. Ezek közé tartozik a tervezés, a webböngészés, az érdeklődési köröd megjegyzése, sőt még a bevásárlás is, lépésről lépésre történő iránymutatás nélkül, mivel maguk is rájönnek a dolgokra.
Google Cloud az AI ügynököket olyan “szoftverrendszereknek” definiálja, amelyek AI-t használnak a célok megvalósítására és a felhasználók helyett történő feladatok elvégzésére.
Amit igazán különlegessé tesz ezeket az AI modelleket, az az előrehaladott gondolkodási képességük, amely lehetővé teszi számukra, hogy többféle információt – audiót, szöveget, videót, kódot és képeket – egyszerre dolgozzanak fel. Képesek az emberekhez hasonlóan megérteni a bonyolult helyzeteket, cselekedni és interakcióba lépni a szoftverekkel és platformokkal.
Sok tech cég most arra törekszik, hogy AI modelleiket ezen a következő szinten fejlesszék.
Csak néhány napja, az OpenAI bejelentette, hogy az AI modeljei, az o3 és az o4-mini képesek “gondolkodni” képekkel és manipulálni őket – például megvágni vagy átalakítani őket. Eközben a Microsoft új “Számítógéphasználat” funkciója lehetővé teszi AI ügynökei számára, hogy felismerjék a grafikus felhasználói felületeket.
“Ha egy személy tudja használni az alkalmazást, az ügynök is képes rá,” – mondta Charles Lamanna, a Microsoft Üzleti és Ipari Copilot alelnöke a bejelentésben.
A következő szint: Az ügynöki AI technológia
Míg számos technológiai cég ultraintelligens AI chatbotok fejlesztésén dolgozik, az agens alapú AI egy lépéssel tovább megy. Ez a technológia arra összpontosít, hogy rendszereket hozzanak létre, amelyekben több ilyen AI ügynök képes interakcióba lépni és különböző feladatokat végezni, hogy pontosabb és teljesebb eredményeket szolgáltasson.
A közelmúltban egy eDreams által szervezett Tech Talk eseményen tartott előadásában, melynek címe “Az AI ügynökök ereje” volt, Patricia Gutierrez Faxas, az AI szakértő elmagyarázta, hogy ezek a rendszerek különféle struktúrákat vehetnek fel. A több ügynökökből álló rendszerek képesek bonyolult feladatokat egyszerűbbekre bontani, ezeket szakosodott ügynökökre bízni, és különböző típusú hálózatokat kialakítani.
Egy mesterséges intelligencia (AI) ügynök képes lehet egy “Felügyelő” szerepet betölteni, kisebb feladatokat delegálva más specializált ügynököknek, vagy több ügynök is párhuzamosan dolgozhat különálló feladatokon, és összehangolják munkájukat a végső eredmény eléréséhez. Ezeknek a rendszereknek az előnyei közé tartozik a nagyobb pontosság, a nagyobb adatvédelem, és a hibák csökkentése.
Andrew Ng egyetért ezzel a megközelítéssel. Az ő BUILD 2024-es előadásán kiemelte az Agentic AI munkafolyamatok fontosságát a komplex feladatok feldolgozásában, sokkal jobb eredmények elérésével. A teljesítményugrás, mint például a GPT-3.5-ről a GPT-4-re való áttérés – és ezek erősebb eredményei a kódolási benchmarkokon – nagyrészt az agentic munkafolyamatoknak és az agentic gondolkodásnak köszönhető.
Hogyan fogják az AI ügynökök befolyásolni az életünket?
A technológiai cégek különböző megközelítéseket alkalmaznak az Agentic AI-vel kapcsolatban. Az OpenAI a mindennapi felhasználók számára ötletekre összpontosít. Amikor elindították az Operatort, a csapat egy videóban magyarázta, hogy egy személy egyszerűen gondolhat egy ételre, amit szeretne elkészíteni, megkérheti a ChatGPT-t, hogy találja meg a legjobb receptet, és még azt is megvásárolhatja az szükséges hozzávalókat egy online szupermarketből.
Az AI modell feltehet kiegészítő kérdéseket és szünetet tarthat az alapvető feladatok, például a felhasználó hitelkártyájának felhasználásával történő vásárlás végrehajtása előtt. A felhasználók beállíthatnak költési limitet, vagy követelhetik, hogy az asszisztens kérjen megerősítést bármilyen vásárlás előtt.
A rendszeres emberek által használható AI ügynökök lehetőségei végtelennek tűnnek, de a legnépszerűbb felhasználási esetek eddig az utazási ügynökök, személyes vásárlók és adminisztratív asszisztensek szerepét töltötték be – végül is, ki ne szeretne egy személyre szabott technológiát, amely e-maileket küld, emlékezik a fontos születésnapokra, és gondoskodik az adókról?
A Microsoft inkább üzleti irányba mozdult el. A cég bemutatta, hogy a marketingügynökségek hogyan használhatják az AI ügynököket piaci adatgyűjtés automatizálására és belátáson alapuló elemzések generálására, vagy hogy a nagyvállalatok hogyan használhatják őket számlafeldolgozásra a rendszereiken belül.
Mégis, miközben mindezek a felhasználási esetek forradalmiaknak tűnnek, a szakértők egyetértenek abban, hogy még hosszú út áll előttünk. A legtöbb ember még nem tudja használni az AI ügynököket a mindennapi életük javítására, mivel sok ilyen funkció, mint például az Operator, csak a Pro felhasználók számára érhető el, ami havi 200 dollárba kerül.
Szóval, az ügynöki AI megfelel az elvárásoknak?
Számos média címsor ígéri az Agentic AI által vezetett új AI forradalmat. Az iparágban kétségtelenül nagy a felhajtás – és a valóság talán nem is marad messze mögötte. Egy nemrégiben az IBM által közzétett jelentés azt mutatta, hogy számos fejlesztő aktívan kutatja és fejleszti ezt a technológiát.
“Az IBM és a Morning Consult 1000 olyan fejlesztőt kérdezett meg, akik AI alkalmazásokat fejlesztenek vállalatok számára, és 99% -uk azt mondta, hogy kutatják vagy fejlesztik az AI ügynököket,” magyarázta Maryam Ashoori PhD, a termékmenedzsment igazgatója az IBM watsonx.ai-nál. “Szóval igen, a válasz az, hogy a 2025-ös év az ügynökök éve lesz.”
Azonban a szakértők megjegyzik, hogy az AI ügynökök valódi jellegének és működésének többféle értelmezése létezik. Ennek eredményeként a jelenlegi AI ügynökök előrehaladása és teljesítménye gyakran az értékelő személy nézőpontjától és szabványaitól függ.
Az viszont biztos, hogy számos szakértő és döntéshozó mélyen hisz ebben a technológiában és nagy összegeket fektetnek annak fejlesztésébe. Egy nemrégiben készült tanulmány szerint a IT vezetők 84%-a ugyanannyira bízik az AI ügynökökben, mint az emberekben, és az OpenAI 2029-re körülbelül 125 milliárd dolláros bevételt vár.
Bár az Agentic AI technológia még nem teljesen fejlett, és alkalmazása nem annyira elterjedt, mint a chatbotoké – főleg a magas költségei miatt – világos, hogy a körülötte lévő túláradó optimizmus és lelkesedés elegendően erős ahhoz, hogy a következő hónapokban jelentős változásokat hajtson végre.