W języku potocznym pojęcia AI, LLM, Agent AI nieźle się mieszają. Jeśli w danej chwili szukam przepisu na zapiekankę ziemniaczaną i zadaję to pytanie aplikacji na moim telefonie, to kto dla mnie pracuje?
Sprawa ma się dość prosto. LLM-y o których czasami myślimy, że to właśnie AI, to tylko dobrze wyszkolone „kalkulatory do słów”. W początkowych wersjach, nawet zadanie pytania ile to jest 3 razy 6 powodowało, że odpowiedź była udzielana w oparciu o prawdopodobieństwo (!). Na dodatek nie było to prawdopodobieństwo wyliczone w oparciu o czystą matematykę, tylko prawdopodobieństwo kolejnego słowa, które mogłoby się pojawić po 3 * 6 = … (!!!). LLM sam z siebie nie aktywował swojego aparatu rozumowania i stwierdzenia „hej – to jest proste działanie matematyczne – nie muszę zgadywać tylko po prostu policzę”. Żeby LLM zmusić do myślenia trzeba mu o tym było napisać w prompcie, albo ewentualnie przełączyć się na nowszy model. Mówiąc bardzo brutalnie i prawdopodobnie mocno przesadzając można stwierdzić, że LLM to bardzo ładnie wysławiający się głupiec. Nic tak na prawdę nie wie, nic nie umie, nic nie myśli, tylko pracuje na statystyce słów, żeby wyszły ładne kształtne zdania z zachowaniem odpowiedniego tonu i gramatyki. W dużym stopniu odpowiada to wizji „super komputerów” z filmów SF, gdzie komputer stwierdza, że „trzeba wyłączyć silnik, bo inaczej nastąpi eksplozja za 5, 4, 3….” – ale sam nic z tym nie robi. A nie robi z tym nic, bo nie może, bo jest tylko (i aż) kalkulatorem słów.
Z Agentami AI jest trochę inaczej. Jednym z komponentów Agenta AI jest LLM. Pozwala on zrozumieć o co pyta użytkownik, a potem wygenerować dla niego ładną odpowiedź. Jednak agent dodatkowo:
- postrzega środowisko w jakim pracuje
- podejmuje decyzje (np. o pobraniu świeżych informacji z interentu albo wykonania jakiś obliczeń)
- planuje działania, układając sobie „w głowie” co po kolei należy zrobić
- integruje się przy pomocy narzędzi z bazami danych lub innymi narzędziami
- i wreszcie może przyjmować od użytkownika feedback i uwzględniać go przy przyszłych odpowiedziać, bo ma pamięć
Tak więc:
- LLM jest częścią składową Agenta
- Agent podejmuje decyzje, LLM nie podejmuje decyzji – jest tylko „kalkulatorem słów”
- Agent działa w jakimś środowisku, zna narzędzia, dostępne bazy danych, wie gdzie i po co się połączyć, a LLM nie – LLM tylko odpowiada na prompt, jest absolutnym teoretykiem
- Agent ma pamięć i dynamicznie uczy się z doświadczenia, a LLM wie tyle ile nauczył się na etapie trenowania, gdy był tworzony
- Agent może sięgać do baz danych, łączyć się do Internetu, uruchamiać kod, który coś policzy, a LLM pracuje tylko w oparciu o tekst jaki otrzymuje na wejściu – jeśli prześlesz sensowny prompt, to otrzymasz sensowną odpowiedź, ale nie licz na to, że LLM jakoś te dane uzupełni, o ile nie było ich w prompcie ani w procesie uczenia jakiś czas temu
- Agent może realizować określony cel – szukać w internecie, bazach danych, a nawet prowadzić transakcje, uruchamiać procesy, a LLM nie. On tylko generuje tekst
- Agent ma możliwość adaptacji do zmieniającej się sytuacji, a LLM jest absolutnie statyczny.
Wracając wiec do początkowego pytania – co się dzieje i kto odpowiada na pytanie o to jak zrobić zapiekankę ziemniaczaną:
- To jest agent. Najpierw uruchomił LLM, żeby zrozumieć czego chcesz
- Zrozumiał po swojemu co chcesz zrobić i prawdopodobnie uznał, że nie wie jak się robi zapiekankę
- Dlatego przejrzał swoje środowisko i dostępne narzędzia. Gdyby był agentem wyspecjalizowanym w gotowaniu to pewnie miałby dostęp do bazy danych z przepisami, ale… raczej bym na to nie liczył i pewnie podstawowym narzędziem jest wyszukiwarka internetowa
- Agent ma możliwość planowania pracy, więc sobie planuje, np.: poszukam 10 przepisów, pobiorę strony, obejrzę albo nie obejrzę obrazki z tych stron, a potem zbuduję prompt i wyślę go do LLM, który zwróci mi ładny tekst i potem odeślę go do użytkownika
- Teraz Agent wywołuje narzędzia, pobiera wyniki i generuje prompt i wysyła go do LLM żeby uzyskać odpowiedź.
- Odpowiedź oddaje tobie
Myślę że obecnie (rok 2026) w większości pracujemy z Agentami. Czyste LLM obsługiwały nas może około 3 lata temu (2023).





























