🔔 Aktualizacja 2026 - Nowe sekcje: Context Engineering, specyfika modeli, Self-Eval Block, regula "pozytywnych sformulowan"
Framework / Metodologia

Efektywny Prompt

Kompleksowa struktura tworzenia promptow ocenianych 10/10. Im mniej model musi zgadywac, tym lepsza odpowiedz.

7
Warstw
14
Punktow checklist
-40%
Bledow logicznych
7
Struktura frameworku
01 Rola / Persona Kto odpowiada
02 Kontekst Tlo sytuacyjne
03 Zadanie Jeden jasny cel
04 Format Wyjscia Jak odpowiedziec
05 Przyklady Few-shot learning
06 Ograniczenia Czego nie robic
07 Chain-of-Thought Logiczne myslenie

„Kazdy prompt powinien eliminowac domysly po stronie modelu.”

- Zasada nadrzędna frameworku
§00

Co się zmieniło w 2026

„Prompt engineering” jest martwym terminem. Zastąpiło go Context Engineering.

- Andrej Karpathy, X (czerwiec 2025)
LLM to procesor. Okno kontekstowe to RAM. Twoja praca to zarządzanie pamięcią operacyjną - załadowanie dokładnie tych dokumentów i instrukcji, które są potrzebne do danego zadania. Większość błędów agentów AI to nie błędy modelu - to błędy assembli kontekstu.

Dla codziennego użytku: 7 warstw nadal obowiązuje. Ale myśl o nich jako o architekturze kontekstu.
Nowa reguła 2026
Wydajność rozumowania LLM spada po ok. 3 000 tokenach. Sweet spot dla większości zadań: 150–300 słów. Zacznij od krótkiego. Dodawaj tylko to, co naprawia konkretny problem.
Levy, Jacoby, Goldberg (2024) · Liu et al. (2024)
4 strategie zarządzania kontekstem (LangChain)
Write
Zapisz kontekst zewnętrznie
Persystuj instrukcje poza oknem - projekt w Claude.ai, baza wektorowa, pamięć agenta. Traktuj system prompt jak kod produkcyjny.
Select
Pobierz co istotne (RAG)
Nie wrzucaj wszystkiego. Wybierz fragmenty naprawdę potrzebne do tego zapytania. Mniej trafnego > więcej ogólnego.
Compress
Skompresuj historię
Podsumowuj długą historię konwersacji zamiast przekazywać ją surową. Token = pamięć operacyjna.
Isolate
Oddziel konteksty agentów
Każdy sub-agent w przepływie wieloagentowym powinien dostać tylko swój wycinek kontekstu - nie całość.
§00b

Reguły Uwagi - nowe odkrycia

📍

Problem „Lost in the Middle”

Uwaga modelu jest U-kształtna: najwyższa na początku i końcu kontekstu, ponad 30% gorsza dla informacji w środku.

Liu et al. (2024), 2 500+ cytowań - wynik potwierdzony na wszystkich modelach.
✓ Krytyczne instrukcje: POCZĄTEK lub KONIEC
✗ Nigdy w środku długiego prompta
🐘

Pink Elephant - negacje szkodzą

Mówienie modelowi czego nie robić aktywuje to pojęcie jako pierwsze. Przeformułuj każdą negację na pozytywne sformułowanie.
✗ ‚Nie używaj wymysłonych danych’
✓ ‚Używaj wyłącznie danych z podanego kontekstu’
📏

Długość prompta - mniej = lepiej

Uwaga skaluje się O(n²) - każdy dodany token utrudnia wychwycenie tego, co ważne. Zacznij od minimalnej wersji. Rozszerzaj tylko tam, gdzie widzisz konkretny błąd.
Sweet spot: 150–300 słów dla większości zadań
Rosnący zysk do ~1 500 słów; potem malejący
🎯

Success Criteria - standard 2026

Większość złych wyników to brak kryteriów akceptacji. Zdefiniuj jak wygląda „gotowe” zanim zaczniesz pisać zadanie.
Cel: [jedno zdanie]
Kryteria: [lista must-have]
Nie wolno: [lista must-not-do]
§01

7 Warstw Skutecznego Prompta

1
Warstwa 01

Rola / Persona

Kim jest model w tej rozmowie?

  • Podaj stanowisko / dziedzinę eksperta
  • Opcjonalnie: lata doświadczenia, branżę, styl
  • Podaj kontekst odbiorcy (dla kogo model pisze)
Przykład

Jesteś doświadczonym copywriterem B2B z 10-letnim stażem w SaaS. Piszesz dla CFO i VP of Sales w firmach 50–500 pracowników.

Dlaczego to działa: Rola kalibruje słownictwo, poziom techniczności i ton - eliminuje błędy stylistyczne.
2
Warstwa 02

Kontekst

Jakie jest tło sytuacyjne?

  • Opisz aktualną sytuację i istotne dane
  • Dołącz liczby, fragmenty kodu, dokumenty
  • Wyjaśnij co już wiesz / co próbowałeś
  • Ograniczenia zewnętrzne (czas, budżet, tech)
Przykład

Mamy produkt do zarządzania projektami. Cena: 49 USD/mies. Wyróżnik: integracja z Jira w 1 klik. Odbiorca: CFO po 5 podobnych demo.

Dlaczego to działa: Kontekst eliminuje domysły - model nie wypełnia luk własnymi założeniami.
3
Warstwa 03

Zadanie

Co dokładnie ma zrobić model?

  • Jeden cel, jeden aktywny czasownik
  • Unikaj „pomóż mi z...” - za szerokie
  • Preferuj: Napisz / Przeanalizuj / Zrefaktoruj / Oceń
Przykład

Napisz e-mail sprzedażowy (subject + body) do CFO zachęcający do 30-min demo produktu.

Dlaczego to działa: Jeden jasny cel = jeden kierunek. Dwa cele w jednym prompcie dają odpowiedź powierzchowną dla obu.
4
Warstwa 04

Format Wyjscia

Jak ma wyglądać odpowiedź?

  • Długość: maks. X słów / Y akapitów
  • Struktura: lista / tabela / nagłówki / kod
  • Styl: formalny / konwersacyjny / techniczny
  • Każde działanie/krok → min. 1 konkretny przykład
Przykład

Format: subject (maks. 8 słów) + body (150 słów). Styl: bezpośredni, bez żargonu. Jeden CTA. Bez emotikonow.

Dlaczego to działa: Format eliminuje poprawki strukturalne. Wymóg przykładu eliminuje abstrakcyjne odpowiedzi.
5
Warstwa 05

Przyklady

Pokaż, nie tylko opisuj.

  • Podaj 1–3 przykłady wejście → wyjście
  • Możesz podać przykład negatywny + pozytywny
  • Dla zadań kreatywnych: podaj próbkę stylu
Przykład

❌ „Chcemy, żebyste rozważyli...” → korporacyjne ✓ „W 3 klikach połączysz Jira. CFO zaoszczędził 4h/tydzień.” → konkretne

Dlaczego to działa: Przykłady kalibrują styl precyzyjniej niż jakikolwiek opis słowny.
6
Warstwa 06

Ograniczenia

Czego model ma NIE robić?

Przykład

✓ „Używaj wyłącznie danych z kontekstu” - zamiast ‚NIE wymysłaj danych’ (Pink Elephant: negacje aktywują to, czego chcesz uniknąć).

6a. Weryfikacja Regulacyjna

Stosuj dla branży prawniczej, medycznej, finansowej. Wymuś adnotację przy każdym działaniu.

[✓ zgodne z [regulacja]] lub [⚠️ wymaga weryfikacji] + zdanie uzasadnienia

6b. Kalibracja do Skali

Stosuj gdy plan zależy od budżetu, miasta, liczby pracowników. Dodaj warunek progowy.

Jeśli [zmienna] przekracza [próg], zaznacz wprost które działania są niewystarczające.

6c. Sekcja „Czego nie robić”

Dla planów actionable - zawsze wymagaj ostrzeżeń. Plan bez moczarów to połowa mapy.

Na końcu: 3 najćzęstsze błędy przy [tym kontekście] + wyjaśnienie kosztów.
7
Warstwa 07

Chain-of-Thought

Poproś model o przemyślenie przed odpowiedzią.

Stosuj gdy zadanie jest złożone, analityczne lub wieloetapowe. CoT redukuje błędy logiczne o 20–40%. Pomiń gdy używasz modelu z wbudowanym rozumowaniem.

Szablon A

Przemyśl problem krok po kroku, zanim podasz odpowiedź.

Szablon B

Najpierw zidentyfikuj kluczowe założenia. Potem odpowiedz.

Szablon C

Pokaż tok myślenia w <myślenie>, finalną odpowiedź w <odpowiedź>.

Szablon D

Jeśli masz wątpliwości co do faktów, napisz to wprost zamiast zgadywać.

§01b

Specyfika Modeli

Każdy model reaguje inaczej na tę samą instrukcję. Poniższe wskazówki oparte na oficjalnej dokumentacji i testach 2025–2026.

Używaj tagów XML do strukturyzacji - działają lepiej niż Markdown i listy numerowane.
Owijaj przykłady w <example> tagi. Odwołuj się: „korzystając z <context>...”
Instrukcje wykonywane dosłownie - jeśli czegoś nie poprosisz, nie dostaniesz.
CRITICAL! / YOU MUST / NIGDY!!!spokojne, bezpośrednie sformułowania. Agresywny język aktywuje nadmiarowe filtry.
Extended Thinking: tryb adaptive - pozwól modelowi zdecydować kiedy potrzebuje głębszego rozumowania.
GPT-5 to system routingowy - „Przemyśl to dokładnie” przełącza na model rozumujący.
„Think step by step” przy rozumowaniu może szkodzić - model już to robi. OpenAI docs ostrzegają.
Prompty konwersacyjne, naturalne - GPT-5 świetnie inferuje intencje z minimalnego kontekstu.
Dla produkcji: pinuj konkretny snapshot (np. gpt-5-2025-08-07) - zachowanie routera zmienia się.
Zero-shot przed few-shot - sprawdź najpierw bez przykładów.
Preferuje prompty krótkie i bezpośrednie - krócej niż Claude lub GPT.
Zero-shot nie jest preferowany (Google whitepaper) - zawsze dołączaj few-shot.
Okno 2M tokenów: placement kluczowy - instrukcje specyficzne na końcu, po danych.
Problem „lost in the middle” tu szczególnie wyraźny - dane w środku obsługiwane znacznie gorzej.
Gemini Thinking Mode → pomiń explicit CoT.
§02c

Self-Eval Block - Nowość 2026

Każ modelowi zweryfikować własny output przed oddaniem go tobie. Jeden krok eliminuje większość błędów formatowych i merytorycznych.

Blok Weryfikacji (do skopiowania)
Dołącz na końcu każdego prompta dla zadań o wysokiej stawce
Checklist weryfikacji
PRZED ODDANIEM ODPOWIEDZI sprawdź: ☐ Output pasuje do wymaganego formatu ☐ Wszystkie success criteria są spełnione (wymień te, których brakuje) ☐ Twierdzenia niewynikające z danych → [NIEPEWNE] ☐ Kolejne kroki są konkretne i actionable
Opcja: scoring rubric
Oceń odpowiedź (0–5) w każdym wymiarze: - Poprawność - Kompletność - Klarowność - Użyteczność / actionability Jeśli dowolna ocena < 4, popraw zanim oddasz finalną odpowiedź.
💡 Dlaczego to działa: Model przetwarzający własny output jako ewaluator aktywuje inne ścieżki uwagi niż przy generowaniu.
§02

Wzór Gotowego Prompta

Rola + Kontekst
ROLA: Jesteś [stanowisko] z [X lat] dow. w [branży]. Piszesz dla [odbiorcy] w stylu [zwięzłym / formalnym]. KONTEKST: [Opis sytuacji, danych, problemu] wymagane - nie generuj bez: - [Parametr 1]: ___ - [Parametr N]: ___ PRZED ROZP.: Brakuje danych? ZATRZYMAJ SIĘ i zapytaj.
Zadanie + Format
ZADANIE: [Aktywny czasownik] + [cel w 1 zdaniu]. FORMAT: - Długość: [maks. 300 słów] - Struktura: [wstęp→CTA] - Styl: [bez emoji, po polsku] - Na krok: min. 1 przykład SUCCESS CRITERIA: [Lista must-have]
Przykłady + Ograniczenia
PRZYKŁADY: Wejście: [przykład 1] Oczekiwane: [wynik 1] OGRANICZENIA: - Używaj wyłącznie [X] - Pisz w stylu [Y] - Tylko fakty z kontekstu - Na końcu: 3 błędy do unikania
CoT + Self-Eval
ROZUMOWANIE: Przemyśl krok po kroku. Pokaż w <myślenie>, finalną odpowiedź w <odpowiedź>. PRZED ODDANIEM: ☐ Format zgodny ☐ Kryteria spełnione ☐ Niepewne → [?] ☐ Kroki actionable // pomiń CoT jeśli model // ma wbudowane rozumowanie
§03

Skróty Sytuacyjne

Nie każdy prompt potrzebuje wszystkich warstw. Dodaj Self-Eval wszzędzie, gdzie stawka jest wysoka.

Typ zadaniaWymagane warstwyTagi
Proste pytanie / tłumaczenie Zadanie + Format ZadanieFormat
Zadanie kreatywne Rola + Zadanie + Format + Przykłady RolaZadanieFormatPrzykłady
Analiza / raport Kontekst + Zadanie + Format + CoT KontekstZadanieFormatCoT
Zadanie złożone / wieloetapowe Wszystkie 7 warstw + Self-Eval WszystkieCoTSelf-Eval
System prompt agenta AI Wszystkie + iteracja + context assembly WszystkieCoTContext Eng.
Zadanie wysokiej stawki Wszystkie 7 + Self-Eval + Success Criteria WszystkieSelf-EvalSuccess Criteria
§04

Najćzęstsze Błędy

⚠️
„Pomóż mi z marketingiem”
Za szerokie zadanie
„Napisz 3 warianty subject line e-maila na Black Friday dla SaaS B2B”

Jedno rozmyłe zadanie = rozmyta odpowiedź. Aktywny czasownik + precyzyjny cel w jednym zdaniu.

⚠️
Brak jakiegokolwiek kontekstu
Model zgaduje
Dodaj: dane produktu, odbiorcę, historię problemu, ograniczenia

Bez kontekstu model wypełnia luki własnymi założeniami. Plan wygląda OK, ale pasuje do fikcji.

⚠️
„Bądź kreatywny”
Niejednoznaczna instrukcja
Podaj przykład stylu - wejście → oczekiwane wyjście

Przykłady kalibrują styl precyzyjniej niż jakikolwiek opis słowny. Pokaż, nie opisuj.

⚠️
Dwa cele w jednym prompcie
Rozmyta odpowiedź
Jeden prompt = jeden cel. Rozdziel na dwa osobne prompty.

Model obsługuje oba cele powierzchownie. Separacja daje głębię każdemu.

⚠️
Używanie negacji (NIE rób X)
Pink Elephant
Przeformułuj pozytywnie: „Używaj wyłącznie X”

Negacje aktywują to, czego chcesz uniknąć. Pozytywne sformułowania kierują wprost do celu.

⚠️
Plan bez sekcji „czego nie robić”
Mapa bez moczarów
Na końcu: 3 najćzęstsze błędy + wyjaśnienie kosztów

Można wykonać wszystkie właściwe działania i stracić budżet na jeden nieplanowany zły ruch.

§05

Checklist Przed Wysłaniem

Czy jasno określiłem rolę / kto odpowiada?
Czy podałem wystarczający kontekst - i tylko to, co naprawdę potrzebne?
Czy zadanie ma jeden, jasny cel z aktywnym czasownikiem?
Czy określiłem format i długość odpowiedzi?
Czy zdefiniowałem success criteria - jak wygląda „gotowe”?
Czy wymagam min. 1 konkretnego przykładu przy każdym działaniu?
Czy podałem przykłady few-shot dla zadań kreatywnych?
Czy ograniczenia są sformułowane pozytywnie (nie negacją)?
Czy wymagane parametry mają jawną instrukcję STOP?
Czy krytyczne informacje są na początku lub końcu - nie w środku?
Czy (dla branży regulowanej) wymagam adnotacji zgodności?
Czy wymagam sekcji „3 błędy do unikania” na końcu?
Czy poprosiłem o CoT - i czy to nie jest model z wbudowanym rozumowaniem?
Czy dodałem Self-Eval block dla zadań o wysokiej stawce?
Slowniczek pojec
LLM
Large Language Model - duzy model jezykowy (np. Claude, GPT-5, Gemini). Siec neuronowa trenowana na ogromnych zbiorach tekstu, zdolna do generowania i rozumienia jezyka naturalnego.
Chain-of-Thought
Technika promtowania, ktora sklania model do rozpisania toku rozumowania krok po kroku przed podaniem finalnej odpowiedzi. Redukuje bledy logiczne o 20-40%.
LangChain
Popularny framework open-source do budowania aplikacji opartych na LLM. Oferuje gotowe komponenty do lacenia modeli, narzedzi, pamieci i zrodel danych w jeden przeplywy.
Lost in the Middle
Zjawisko badawcze (Liu et al. 2024): model znacznie gorzej przetwarza informacje zakopane w srodku dlugiego kontekstu. Uwaga ma ksztalt litery U - najlepsza na poczatku i koncu.
Gemini Thinking Mode
Tryb rozumowania modeli Gemini (Google), w ktorym model samodzielnie przetwarza problem przed udzieleniem odpowiedzi. Dziala analogicznie do Extended Thinking w Claude. Nie wymaga recznego CoT.
Extended Thinking
Tryb w modelach Claude (Anthropic), ktory pozwala modelowi na wewnetrzne rozumowanie przed odpowiedzia. W trybie adaptive model sam decyduje kiedy potrzebuje glebszego namyslu.
scoring rubric
Szczegolowa skala oceny odpowiedzi (np. 0-5 punktow w kilku wymiarach: poprawnosc, kompletnosc, klarownosc). Dolaczona do prompta sklania model do samodzielnej weryfikacji outputu.
Self-Eval Block
Fragment prompta nakazujacy modelowi sprawdzenie wlasnej odpowiedzi przed jej oddaniem. Aktywuje inne sciezki uwagi niz generowanie - skutecznie eliminuje bledy formatowe i merytoryczne.
success criteria
Kryteria akceptacji - lista warunkow, ktore musi spelnic odpowiedz, zeby uznac zadanie za wykonane. Definiowane przed napisaniem promptu: co musi byc, a czego nie moze byc w outputcie.
CoT
Skrot od Chain-of-Thought. Instrukcja lub technika sklaniajaca model do rozpisania krokow rozumowania. Stosuj przy zadaniach zlozonych; pominij gdy model ma wbudowane rozumowanie.