Agenci AI i automatyzacja procesów
Od rozmowy do wykonawcy. Dziś budujemy agentów, którzy robią robotę za Ciebie — pod nadzorem i z zabezpieczeniami.
Budowa agentów AI oraz projektowanie systemów wykonujących serie zadań
Rozumiesz, czym jest agent i czym różni się od chatbota. Znasz 5 komponentów agenta (planer, narzędzia, pamięć, pętla, walidacja) i wiesz, kiedy budować agenta, a kiedy wystarczy prompt.
1. Chatbot vs Asystent vs Agent
| Typ | Co robi | Przykład | Co potrafi |
|---|---|---|---|
| Chatbot | Odpowiada | Zwykły ChatGPT | Generuje tekst na zapytanie |
| Asystent | Odpowiada w roli + z wiedzą | Custom GPT, Claude Project | Tekst + pliki wiedzy + narzędzia proste (web, kod) |
| Agent | Wykonuje zadania wieloetapowe | ChatGPT Agent, Devin, Manus, n8n z AI | Planuje → wykonuje kroki → używa narzędzi → sprawdza wynik → iteruje |
| Orkiestrator (multi-agent) | Koordynuje kilku agentów | CrewAI, LangGraph, Make.com scenariusze | Dzieli zadanie, deleguje, zbiera wyniki |
2. Anatomia agenta - 5 komponentów
Model LLM, który myśli: rozbija zadanie na kroki, wybiera narzędzia, decyduje kiedy skończyć.
Promptowy przykład: „Zanim wykonasz, zaplanuj 3-7 kroków. Dla każdego wskaż, jakie narzędzie użyjesz."
Funkcje, które agent może wywołać: wyszukiwarka, kalkulator, kalendarz, email, baza danych, API.
Kluczowe: każde narzędzie ma opis „co robi, co przyjmuje, co zwraca" — agent sam wybiera.
Gdzie agent zapisuje wyniki pośrednie, żeby nie zgubić wątku w długim zadaniu.
Typy: short-term (w oknie kontekstu) / long-term (baza wektorowa) / episodic (dziennik sesji).
Mechanizm: plan → akcja → obserwacja → refleksja → plan dalszy.
ReAct pattern: Reason + Act. Model pisze co myśli, co robi, co widzi — i decyduje dalej.
Kontrola, czy agent nie robi głupot: warunek stopu, limit kroków, zgoda człowieka na krytyczne akcje.
Minimum: max_steps = 10, human-in-the-loop dla wysyłania maili / płatności.
- Prompt wystarczy: zadanie 1-krokowe, zrozumiałe, dobrze zdefiniowane
- Asystent: powtarzalne, z wiedzą, ale bez akcji zewn.
- Agent: wieloetapowe, wymaga decyzji, sięga do zewn. danych/systemów
- Prawdziwy sprawdzian: „czy potrafię to rozpisać w 5 linii?" Tak → prompt. Nie → agent.
3. Przykłady agentów z różnych ról
| Rola | Agent | Kroki |
|---|---|---|
| Sprzedawca B2B | Research klienta przed spotkaniem | 1) Wyszukaj firmę → 2) Pobierz ostatnie news → 3) LinkedIn decydentów → 4) Analiza finansowa → 5) Przygotuj brief 1 strona |
| HR | Pre-screening CV | 1) Pobierz CV z ATS → 2) Porównaj z profilem → 3) Wystaw ocenę 1-10 + uzasadnienie → 4) Wygeneruj 3 pytania rekrutacyjne → 5) Zapisz raport |
| Księgowość | Kategoryzator faktur | 1) Pobierz PDF z maila → 2) OCR → 3) Dopasuj kontrahenta z bazy → 4) Wyznacz kategorię VAT → 5) Dodaj do systemu + alert gdy niepewne |
| Nauczyciel | Ocenianie prac pisemnych | 1) Przeczytaj pracę → 2) Oceń wg rubryki → 3) Wygeneruj feedback → 4) Zapisz do bazy → 5) Wyślij mailem uczniowi |
| Project manager | Statusy tygodniowe | 1) Pobierz update z każdego członka (mail/Slack) → 2) Zsyntezuj → 3) Sprawdź status zadań w Jira → 4) Wygeneruj raport → 5) Wyślij interesariuszom |
Twój agent - projekt
- Z Twoich 5 zadań z dnia 1 - wybierz JEDNO, które jest wieloetapowe.
- Rozpisz je na 3-7 kroków (co by zrobił człowiek).
- Dla każdego kroku wskaż: jakie dane wejściowe, jakie narzędzie, jakie dane wyjściowe.
- Oznacz kroki, w których POTRZEBNA JEST decyzja człowieka (human-in-the-loop).
- Oznacz krytyczne - te, które mogą nieodwracalnie wpłynąć (wysłanie maila, zapis do systemu).
- Zapisz jako szkic swojego agenta - użyjemy w bloku 4.
Zaawansowane łączenie agentów i automatyzacja procesów
Znasz 3 główne platformy no-code do budowania agentów (Make.com / n8n / Zapier) i wiesz, kiedy której użyć. Rozumiesz wzorce multi-agent: router, specjalista, krytyk.
1. Porównanie platform automatyzacji
| Narzędzie | Typ | Krzywa uczenia | Cena | Kiedy wybrać |
|---|---|---|---|---|
| Make.com (d. Integromat) | No-code, wizualny | Średnia | €9-29/m | Najbardziej elastyczne, wizualne, moduły AI wbudowane |
| n8n | Low-code, self-hostable | Wyższa | Darmowe self-host / €20+ | Prywatność, zaawansowana logika, open-source |
| Zapier | No-code, klikalny | Niska | $20-60/m | Najszybszy start, najwięcej gotowych integracji |
| Power Automate (Microsoft) | No/low-code | Średnia | W M365 | Ekosystem Microsoft, Teams, Office |
| ChatGPT Agent (OpenAI) | Zintegrowany | Niska | W Plus/Pro | Przeglądarka + terminal + obrazy w jednym |
| Claude Computer Use / Claude Agent SDK | Dla programistów | Wysoka | API | Custom, klik-w-klik w prawdziwym UI |
2. Architektura multi-agent - 4 wzorce
Agent-dyspozytor klasyfikuje zadanie i deleguje do specjalisty.
Przykład: Mail przychodzi → router dzieli na: reklamacja / zapytanie ofertowe / zwykła rozmowa → każdy trafia do osobnego agenta.
Agenci w łańcuchu, wynik jednego to wejście następnego.
Przykład: Research → pisarz oferty → redaktor → weryfikator prawny → wysyłający.
Kilku agentów robi tę samą rzecz niezależnie, potem agregacja.
Przykład: 3 modele odpowiadają na to samo pytanie → czwarty porównuje i wybiera lub syntezuje.
Jeden agent wykonuje, drugi go weryfikuje i pcha do poprawy.
Przykład: Pisarz pisze raport → krytyk znajduje 5 słabości → pisarz poprawia → iteracja, aż krytyk zaakceptuje.
3. Przykład scenariusza Make.com - klasyfikator maili
4. Gdy jeden agent nie wystarcza
Zaprojektuj architekturę
- Weź agenta z ćwiczenia 1.
- Zastanów się, czy lepszy jest single-agent czy multi-agent.
- Jeśli multi - zaznacz wzorzec (router/kaskada/parallel/krytyk).
- Naszkicuj diagram (kartka lub Excalidraw/draw.io): moduły, strzałki, warunki, punkty decyzji.
- Wskaż w nim: gdzie jest human-in-the-loop, gdzie obsługa błędów, gdzie warunki stopu.
Autonomiczni agenci i powtarzalne rezultaty bez stałego nadzoru
Rozumiesz spektrum autonomii: od „za każdym razem pytamy" do „pełna autonomia z logiem". Umiesz dobrać poziom autonomii do wartości i ryzyka zadania.
1. Pięć poziomów autonomii agenta
| Poziom | Nazwa | Opis | Kiedy |
|---|---|---|---|
| L1 | Asystent | AI proponuje, człowiek klika „wykonaj" | Zadanie z konsekwencjami (mail do klienta, decyzja rekrutacyjna) |
| L2 | Z zatwierdzeniem | AI wykonuje, ale po człowiek sprawdza | Szablonowe zadania, ale wynik idzie dalej (raporty, klasyfikacje) |
| L3 | Z przeglądem wyrywkowym | AI wykonuje samodzielnie; człowiek przegląda co 10-20 wyników | Duży wolumen, niskie ryzyko na pojedynczej pozycji |
| L4 | Z alarmami | AI pełna autonomia + alerty gdy coś nietypowego | Rutynowe operacje, jasne KPI |
| L5 | Pełna autonomia | AI działa samodzielnie, log do przeglądu post-factum | Bardzo powtarzalne, małe koszty błędu, mierzalne wyjście |
2. Jak wybrać poziom - matryca ryzyko/wartość
| Koszt błędu | Liczba zadań | Sugerowany poziom |
|---|---|---|
| Wysoki (klient, pieniądze, reputacja) | Mało | L1 - L2 |
| Średni (operacyjny, odwracalny) | Mało | L2 |
| Średni | Dużo (setki/msc) | L3 |
| Niski (korekta łatwa) | Dużo | L4 |
| Niski | Bardzo dużo | L5 (z monitoringiem) |
3. Zabezpieczenia (guardrails) dla autonomicznych agentów
- Max iteracji (np. 10 kroków)
- Max koszt (np. $5 na zadanie)
- Timeout (np. 5 minut)
- Whitelist narzędzi (tylko dozwolone akcje)
- Rate limiting (max N operacji/godz.)
- Sandbox (dla kodu - kontener, osobne konto)
- Warunki stopu: „jeśli pewność < 70% → stop, pytaj człowieka"
- Krytyczne akcje: zawsze wymaga potwierdzenia
- Próg finansowy: powyżej X zł - człowiek
- Walidacja wyjścia: sprawdzenie formatu, zakresu, sensu
- Kontrola spójności: czy wynik zgadza się z wcześniejszymi
- Circuit breaker: 3 błędy z rzędu → stop cały flow
- Log każdej akcji (kto/co/kiedy)
- Możliwość rollback (odwrócenie zmian)
- Dziennik decyzji (dlaczego AI tak wybrało)
- Alerty do człowieka przy anomaliach
- Tydzień obserwacji przed pełnym wdrożeniem
- Regularny audyt (co kwartał - co działa, co nie)
- Info dla użytkowników: „pisze/odpowiada AI"
- Brak dyskryminacji: testy na bias przy decyzjach kadrowych
- RODO: które dane są przetwarzane, gdzie
- Eskalacja: użytkownik może poprosić o człowieka
- Dokumentacja: policy kiedy AI, kiedy nie
- DPIA (dla większych wdrożeń)
Poziom autonomii dla Twojego agenta
- Dla swojego agenta (z bloków 1-2) wybierz poziom L1-L5.
- Uzasadnij: koszt błędu, wolumen, odwracalność.
- Dopisz konkretne zabezpieczenia (techniczne + logiczne + procedur.).
- Określ, jak zmierzysz sukces/porażkę w pierwszych 2 tygodniach.
- Określ, co by spowodowało cofnięcie do niższego poziomu.
Warsztat tworzenia własnych narzędzi do automatyzacji
Budujesz działającego agenta w Make.com (lub alternatywnie w n8n/Zapier) na realnym przypadku. Wychodzisz z uruchomionym scenariuszem, który przetworzy 1-2 realne zdarzenia.
Workflow warsztatu
- Załóż konto na make.com (darmowe, 1000 operacji/msc).
- Poznaj interfejs: Scenarios → Create scenario.
- Zainstaluj lokalną aplikację Make jeśli potrzebna (niektóre integracje).
- Podłącz swoje konto Google/Microsoft (dla Gmail/Outlook/Drive).
- Dodaj moduł Gmail/Outlook → "Watch emails" lub Google Drive → "Watch files".
- Ustaw kryteria (folder, etykieta, typ pliku).
- Uruchom "Run once" - zobacz strukturę danych przychodzących.
- Zanotuj, które pola są dla Ciebie kluczowe.
- Dodaj moduł OpenAI (lub Anthropic dla Claude).
- Podłącz klucz API (przygotuj wcześniej na platform.openai.com).
- Wybierz "Create a Chat Completion" - model gpt-4o-mini (tani) lub gpt-4o (lepszy).
- Wklej system prompt: rolę agenta (z dnia 2).
- User message: zmapuj pola z trigger (np. treść maila).
- Response format: JSON z polami [kategoria, priorytet, streszczenie, akcje[]].
- Uruchom test - sprawdź, czy dostaje sensowny JSON.
- Dodaj Router po module AI.
- Każda ścieżka = inna kategoria (z JSONa).
- Dla każdej dodaj akcję: Slack / Email / Sheets / Trello / itp.
- Przetestuj każdą ścieżkę osobno (Run once z próbką danych).
- Dodaj error handler do modułu AI (Resume/Ignore/Break).
- Dodaj limit: Scenarios Settings → Max cycles, Run interval.
- Dodaj moduł Google Sheets "log" na końcu - zapisuj każdy przebieg.
- Aktywuj scenariusz (Scheduling: Every 15 min lub na trigger).
- Zostaw na 1h działania. Przejrzyj log. Popraw co nie działa.
- JSON malformed - dodaj w system prompcie: "Odpowiadaj DOKŁADNIE w JSON, bez markdown, bez komentarzy"
- Gubi się w długich mailach - tnij treść do 2000 znaków lub używaj gpt-4o (większy kontekst)
- Za dużo false positive - dodaj przykłady few-shot w prompcie
- Brak obsługi "innego" - dodaj kategorię INNE + ścieżkę "do ręcznej weryfikacji"
- Duplikaty - sprawdzaj ID maila/pliku przed przetworzeniem
- Pętla nieskończona - ZAWSZE ustawiaj Max cycles na scenariuszu
Przegląd rozwiązań i plan odmiany pracy
Każdy pokazuje swojego agenta. Wspólnie tworzymy mapę „kto co automatyzuje" — inspiracja dla reszty grupy. Wychodzisz z planem 3 kolejnych agentów.
Prezentacje (2 min na osobę)
- Jaki proces - 1 zdanie
- Jakie kroki - 3-5 bulletów
- Demo na żywo (lub screenshot, jeśli za długo)
- Co się udało / co poprawie
- Szacowana oszczędność (godziny/miesiąc)
Mapa "Co można zautomatyzować" - inspiracja
| Obszar | Konkrete automatyzacje (z gotowych przykładów) |
|---|---|
| Komunikacja | Klasyfikacja maili, auto-odpowiedzi na FAQ, podsumowania dziennie, alerty o pilnych |
| Sprzedaż | Research klientów, generowanie ofert, follow-upy, kwalifikacja leadów, analiza lost-deals |
| Dokumenty | OCR faktur, ekstrakcja danych z umów, generowanie raportów, archiwizacja |
| HR | Screening CV, generowanie opisów stanowisk, pre-interview pytania, onboarding checklist |
| Marketing | Social content z bloga, monitoring marki, analiza konkurencji, ideacja |
| Finanse | Kategoryzacja kosztów, alerty przekroczenia, ekstrakcja z faktur, prognozy prosty |
| Produkcja/operacje | Klasyfikacja błędów, analiza logów, prognozy awarii, harmonogramy |
| Edukacja | Feedback na prace, quizy, personalizacja kursów, analiza postępów |
Twoja roadmapa 3 agentów
- Zainspirowany prezentacjami grupy - wypisz 3 procesy, które warto zautomatyzować.
- Dla każdego oszacuj: oszczędność czasu (h/msc), trudność budowy (1-10), ryzyko (1-10).
- Ułóż w kolejności: szybkie wygrane (wysoka oszczędność, niska trudność) najpierw.
- Dla #1 - wyznacz termin do 2 tygodni po szkoleniu.
- Dla #2 - do 1 miesiąca.
- Dla #3 - do 3 miesięcy.
- Agent = AI + narzędzia + pętla decyzyjna. 5 komponentów: planer, narzędzia, pamięć, pętla, walidacja.
- Multi-agent w 4 wzorcach: router, kaskada, równoległy, krytyk.
- 5 poziomów autonomii. Dobierz do kosztu błędu i wolumenu.
- Zabezpieczenia w 4 warstwach: techniczne + logiczne + proceduralne + etyczne.
- Masz działającego agenta w Make.com i mapę 3 kolejnych.