# Kalkulator kosztów AI — praktyczny cheatsheet

> Przed wdrożeniem agenta **policz koszty**. Różnica między „tani" a „drogi" wynosi często 100x.
> Aktualizacja: kwiecień 2026.

---

## 1. Jednostki — co to są „tokeny"?

**Token** ≈ 0.75 słowa (dla angielskiego) lub 0.5-0.6 słowa (dla polskiego — mniej efektywny tokenizer).

**Przykłady:**
- „Cześć jak się masz" = **6-7 tokenów**
- 1 strona A4 tekstu (250 słów po polsku) = **~400-500 tokenów**
- Artykuł 1000 słów = **~1700 tokenów**
- 100-stronicowy PDF = **~50 000 tokenów**
- Cała książka „Sapiens" = **~200 000 tokenów**

**Pomiar:** platform.openai.com/tokenizer (sklej tekst, zobacz liczbę).

---

## 2. Cennik popularnych modeli (kwiecień 2026, za 1M tokenów)

### 🤖 API chat

| Model | Input | Output | Kontekst | Uwagi |
|---|---|---|---|---|
| **GPT-4o-mini** | $0.15 | $0.60 | 128k | workhorse tani |
| **GPT-4o** | $2.50 | $10.00 | 128k | jakość GPT-4 |
| **GPT-5** | $1.25 | $10.00 | 400k | najnowszy, wielozadaniowy |
| **Claude Haiku 4.5** | $1.00 | $5.00 | 200k | szybki, tani |
| **Claude Sonnet 4.6** | $3.00 | $15.00 | 200k | workhorse kodowy |
| **Claude Opus 4.7** | $15.00 | $75.00 | 1M | najmądrzejszy, drogi |
| **Gemini 2.5 Flash** | $0.075 | $0.30 | 1M | **NAJTAŃSZY**, 1M ctx |
| **Gemini 2.5 Pro** | $1.25 | $5.00 | 2M | 2M kontekstu! |
| **Groq Llama 3.3 70B** | **DARMOWE** (z limitami) | **DARMOWE** | 128k | najszybszy |
| **Cerebras Llama 3.1 70B** | **DARMOWE** | **DARMOWE** | 128k | najszybszy API |
| **DeepSeek V3** | $0.27 | $1.10 | 64k | dobry tańszy |

### 🎙️ Audio / TTS / STT

| Narzędzie | Cena | Limit FREE |
|---|---|---|
| OpenAI Whisper API | $0.006 / min | — |
| OpenAI TTS | $15 / 1M znaków | — |
| ElevenLabs | $5-330 / mc | 10 000 znaków/mc |
| Edge TTS (Microsoft) | **DARMOWE** (Bing TTS) | bez limitu |

### 🖼️ Generowanie obrazów

| Model | Cena | Limit FREE |
|---|---|---|
| DALL-E 3 | $0.040-0.080 / obraz | — |
| Midjourney v7 | $10/mc | — |
| Flux (BFL) | $0.003-0.05 / obraz | — |
| Stable Diffusion (local) | **DARMOWE** | — (Twój GPU) |
| Imagen 4 (Google AI Studio) | **DARMOWE** w FREE tier | limitowane |

---

## 3. Typowe koszty workflow (realne case'y)

### Klasyfikator emaili (100 maili/dzień)

| Komponent | Model | Tokeny/mail | Koszt/dzień |
|---|---|---|---|
| Klasyfikacja | GPT-4o-mini | 500 in + 100 out | $0.015 |
| Log do Sheets | — | — | darmowy |
| **Razem miesięcznie** | | | **~$0.45 (1.80 PLN)** |

**Z Gemini Flash:** **~$0.08/mc (0.30 PLN)**. Różnica 5x.

### Briefing CEO (1 dziennie, 7:30)

| Komponent | Model | Tokeny | Koszt |
|---|---|---|---|
| Zbieranie z 5 źródeł | — | — | darmowy |
| Sumowanie | Claude Sonnet | 5000 in + 1000 out | $0.03 |
| **Razem miesięcznie** (30 dni) | | | **~$0.90 (3.60 PLN)** |

### Multi-agent artykuł (10 artykułów/mc)

| Agent | Model | Koszt/artykuł |
|---|---|---|
| Researcher | Perplexity API | $0.15 |
| Writer (3 iter.) | Claude Sonnet | $0.20 |
| Critic (3 iter.) | Claude Haiku | $0.05 |
| **Razem** | | **$0.40** |

**10 artykułów/mc: $4 (16 PLN).** Profesjonalny content writer: 500-1500 PLN/artykuł.

### Chatbot strony www (500 rozmów/dzień)

| Komponent | Model | Tokeny/rozmowa | Koszt/dzień |
|---|---|---|---|
| Chat | GPT-4o-mini | 2000 in + 500 out | $0.45 |
| RAG (embeddings) | OpenAI ada-002 | 500 tok | $0.01 |
| **Razem miesięcznie** | | | **~$14 (56 PLN)** |

---

## 4. Jak TANIEJ — 10 trików

1. **Używaj mini/flash/haiku wszędzie, gdzie się da.** Podnieś model tylko jeśli jakość niewystarczająca. Różnica cenowa: 10-20x.

2. **Rotuj między dostawcami z darmowymi tierami:**
   - Claude.ai — 15-30 wiadomości/3h FREE
   - ChatGPT — 10 wiadomości/3h FREE
   - Gemini — hojne
   - Groq — 7k tok/min FREE (dla personal use)
   - Google AI Studio — Gemini 2.5 Pro FREE

3. **Prompt caching** (Anthropic, OpenAI) — cacheujesz długi system prompt, płacisz tylko za user input. Oszczędność 50-90% przy długich system prompt.

4. **Batch API** (OpenAI, Anthropic) — 50% taniej, ale opóźnienie 24h. Dla raportów nocnych, klasyfikacji bulk.

5. **Streaming** — zaczynasz widzieć odpowiedź zanim się skończy. Nie zmniejsza kosztu, ale UX lepszy.

6. **Krótsze prompt**y — każde 100 tokenów input to koszt. System prompt 2000 słów? Zetnij do 500 + resztę do plików wiedzy.

7. **Embeddings + RAG** zamiast wrzucania WSZYSTKIEGO w kontekst. Zamiast 50k tokenów w każdym zapytaniu → 500 tok po wyszukaniu wektorowym.

8. **Local models** dla prywatnych danych. Ollama + Llama 3.3 8B działa na Macu M1/M2. Zero kosztu, zero wycieku.

9. **Spróbuj Gemini 2.5 Flash** — $0.075/1M input jest śmiesznie tanie. W 80% przypadków wystarczy.

10. **Monitoruj w czasie rzeczywistym** — Langfuse, Helicone. Zobaczysz gdzie tracisz.

---

## 5. Kalkulator: kiedy AI zwróci się?

### Wzór

```
Zysk z AI na mc = 
  (Godziny zaoszczędzone/mc) × (Stawka godzinowa) 
  − (Koszt AI/mc) 
  − (Koszt wdrożenia ÷ 12 mc)
```

### Przykład 1: Klasyfikator emaili

- Oszczędność: 8h/mc (brigrąd nie musi triage'ować)
- Stawka: 80 PLN/h
- **Zysk z czasu:** 640 PLN/mc
- Koszt AI: 2 PLN/mc (model) + 10 EUR/mc (Make.com Pro) = ~45 PLN/mc
- Wdrożenie: 6h × 80 PLN = 480 PLN, ÷ 12 = 40 PLN/mc
- **NET: 640 − 45 − 40 = 555 PLN/mc zysku.**
- **ROI: 12.5x** (za 1 PLN inwestycji — 12.50 PLN zwrotu).

### Przykład 2: Briefing CEO

- CEO stawka: 500 PLN/h
- Oszczędza: 1h/dzień × 20 dni = 20h/mc
- **Zysk:** 10 000 PLN/mc
- Koszt AI: 4 PLN/mc
- Wdrożenie: 10h × 80 PLN = 800 PLN ÷ 12 = 67 PLN/mc
- **NET: 10 000 − 4 − 67 = 9929 PLN/mc.**
- **ROI: ~140x.**

### Ostrzeżenie

- **Nie wlicz tego, czego realnie nie wycofasz.** Jeśli zaoszczędzisz CEO 1h/dzień, a on wyda ją na lepsze decyzje → OK. Ale jeśli spędzi na LinkedIn → ROI księgowy pozostaje, ale realny NIE.
- **Nie przeceniaj oszczędności.** Typowy błąd: „Zaoszczędzę 20h/tydzień!" — realnie 5-10h na początku, 15-20 po 3 mc optymalizacji.

---

## 6. Szablon do policzenia dla SIEBIE

```markdown
## Moje wyliczenie ROI dla [NAZWA AGENTA]

### Czas
- Obecnie zajmuje mi: [X] min/dzień × [Y] dni/mc = [Z] h/mc
- Z AI zajmie: [A] min/dzień × [Y] dni/mc = [B] h/mc
- **Oszczędność: [Z-B] h/mc**

### Koszty
- Model AI: ~$[X]/mc × 4 PLN = [Y] PLN/mc
- Platforma (Make/Zapier): [Z] PLN/mc
- Inne (hosting, storage): [A] PLN/mc
- **RAZEM koszt miesięczny: [X+Y+Z+A] PLN**

### Wdrożenie
- Czas wdrożenia: [X] h × [stawka] PLN = [Y] PLN
- **Amortyzacja: [Y]/12 = [Z] PLN/mc**

### ROI
- Moja stawka: [X] PLN/h
- Wartość oszczędności: [Z-B] × [X] = [Y] PLN/mc
- **NET: [Y] − [koszt] − [amortyzacja] = [Z] PLN/mc**
- **ROI: [Z] ÷ [wkład początkowy] = [N]x**

### Warunki zatrzymania (co by spowodowało wyłączenie agenta)
- Accuracy spada poniżej: [X]%
- Koszt miesięczny przekracza: [Y] PLN
- Liczba eskalacji > [Z] / tydzień
- Skargi klientów > [A] / mc
```

---

*AI Master · Dzień 5 · kalkulator kosztów AI · 29.04.2026*