SevenPROMPTS - Framework 7 Warstw 2026

§00

Co się zmieniło w 2026

„Prompt engineering” jest martwym terminem. Zastąpiło go Context Engineering.

- Andrej Karpathy, X (czerwiec 2025)

LLM to procesor. Okno kontekstowe to RAM. Twoja praca to zarządzanie pamięcią operacyjną - załadowanie dokładnie tych dokumentów i instrukcji, które są potrzebne do danego zadania. Większość błędów agentów AI to nie błędy modelu - to błędy assembli kontekstu.

Dla codziennego użytku: 7 warstw nadal obowiązuje. Ale myśl o nich jako o architekturze kontekstu.

Nowa reguła 2026

Wydajność rozumowania LLM spada po ok. 3 000 tokenach. Sweet spot dla większości zadań: 150–300 słów. Zacznij od krótkiego. Dodawaj tylko to, co naprawia konkretny problem.

Levy, Jacoby, Goldberg (2024) · Liu et al. (2024)

4 strategie zarządzania kontekstem (LangChain)

Write

Zapisz kontekst zewnętrznie

Persystuj instrukcje poza oknem - projekt w Claude.ai, baza wektorowa, pamięć agenta. Traktuj system prompt jak kod produkcyjny.

Select

Pobierz co istotne (RAG)

Nie wrzucaj wszystkiego. Wybierz fragmenty naprawdę potrzebne do tego zapytania. Mniej trafnego > więcej ogólnego.

Compress

Skompresuj historię

Podsumowuj długą historię konwersacji zamiast przekazywać ją surową. Token = pamięć operacyjna.

Isolate

Oddziel konteksty agentów

Każdy sub-agent w przepływie wieloagentowym powinien dostać tylko swój wycinek kontekstu - nie całość.

§00b

Reguły Uwagi - nowe odkrycia

📍

Problem „Lost in the Middle”

Uwaga modelu jest U-kształtna: najwyższa na początku i końcu kontekstu, ponad 30% gorsza dla informacji w środku.

Liu et al. (2024), 2 500+ cytowań - wynik potwierdzony na wszystkich modelach.

✓ Krytyczne instrukcje: POCZĄTEK lub KONIEC
✗ Nigdy w środku długiego prompta

🐘

Pink Elephant - negacje szkodzą

Mówienie modelowi czego nie robić aktywuje to pojęcie jako pierwsze. Przeformułuj każdą negację na pozytywne sformułowanie.

✗ ‚Nie używaj wymysłonych danych’
✓ ‚Używaj wyłącznie danych z podanego kontekstu’

📏

Długość prompta - mniej = lepiej

Uwaga skaluje się O(n²) - każdy dodany token utrudnia wychwycenie tego, co ważne. Zacznij od minimalnej wersji. Rozszerzaj tylko tam, gdzie widzisz konkretny błąd.

Sweet spot: 150–300 słów dla większości zadań
Rosnący zysk do ~1 500 słów; potem malejący

🎯

Success Criteria - standard 2026

Większość złych wyników to brak kryteriów akceptacji. Zdefiniuj jak wygląda „gotowe” zanim zaczniesz pisać zadanie.

Cel: [jedno zdanie]
Kryteria: [lista must-have]
Nie wolno: [lista must-not-do]

§01

7 Warstw Skutecznego Prompta

Warstwa 01

Rola / Persona

Kim jest model w tej rozmowie?

Podaj stanowisko / dziedzinę eksperta
Opcjonalnie: lata doświadczenia, branżę, styl
Podaj kontekst odbiorcy (dla kogo model pisze)

Przykład

Jesteś doświadczonym copywriterem B2B z 10-letnim stażem w SaaS. Piszesz dla CFO i VP of Sales w firmach 50–500 pracowników.

Dlaczego to działa: Rola kalibruje słownictwo, poziom techniczności i ton - eliminuje błędy stylistyczne.

Warstwa 02

Kontekst

Jakie jest tło sytuacyjne?

Opisz aktualną sytuację i istotne dane
Dołącz liczby, fragmenty kodu, dokumenty
Wyjaśnij co już wiesz / co próbowałeś
Ograniczenia zewnętrzne (czas, budżet, tech)

Przykład

Mamy produkt do zarządzania projektami. Cena: 49 USD/mies. Wyróżnik: integracja z Jira w 1 klik. Odbiorca: CFO po 5 podobnych demo.

Dlaczego to działa: Kontekst eliminuje domysły - model nie wypełnia luk własnymi założeniami.

Warstwa 03

Zadanie

Co dokładnie ma zrobić model?

Jeden cel, jeden aktywny czasownik
Unikaj „pomóż mi z...” - za szerokie
Preferuj: Napisz / Przeanalizuj / Zrefaktoruj / Oceń

Przykład

Napisz e-mail sprzedażowy (subject + body) do CFO zachęcający do 30-min demo produktu.

Dlaczego to działa: Jeden jasny cel = jeden kierunek. Dwa cele w jednym prompcie dają odpowiedź powierzchowną dla obu.

Warstwa 04

Format Wyjscia

Jak ma wyglądać odpowiedź?

Długość: maks. X słów / Y akapitów
Struktura: lista / tabela / nagłówki / kod
Styl: formalny / konwersacyjny / techniczny
Każde działanie/krok → min. 1 konkretny przykład

Przykład

Format: subject (maks. 8 słów) + body (150 słów). Styl: bezpośredni, bez żargonu. Jeden CTA. Bez emotikonow.

Dlaczego to działa: Format eliminuje poprawki strukturalne. Wymóg przykładu eliminuje abstrakcyjne odpowiedzi.

Warstwa 05

Przyklady

Pokaż, nie tylko opisuj.

Podaj 1–3 przykłady wejście → wyjście
Możesz podać przykład negatywny + pozytywny
Dla zadań kreatywnych: podaj próbkę stylu

Przykład

❌ „Chcemy, żebyste rozważyli...” → korporacyjne ✓ „W 3 klikach połączysz Jira. CFO zaoszczędził 4h/tydzień.” → konkretne

Dlaczego to działa: Przykłady kalibrują styl precyzyjniej niż jakikolwiek opis słowny.

Warstwa 06

Ograniczenia

Czego model ma NIE robić?

Przykład

✓ „Używaj wyłącznie danych z kontekstu” - zamiast ‚NIE wymysłaj danych’ (Pink Elephant: negacje aktywują to, czego chcesz uniknąć).

6a. Weryfikacja Regulacyjna

Stosuj dla branży prawniczej, medycznej, finansowej. Wymuś adnotację przy każdym działaniu.

[✓ zgodne z [regulacja]] lub [⚠️ wymaga weryfikacji] + zdanie uzasadnienia

6b. Kalibracja do Skali

Stosuj gdy plan zależy od budżetu, miasta, liczby pracowników. Dodaj warunek progowy.

Jeśli [zmienna] przekracza [próg], zaznacz wprost które działania są niewystarczające.

6c. Sekcja „Czego nie robić”

Dla planów actionable - zawsze wymagaj ostrzeżeń. Plan bez moczarów to połowa mapy.

Na końcu: 3 najćzęstsze błędy przy [tym kontekście] + wyjaśnienie kosztów.

Warstwa 07

Chain-of-Thought

Poproś model o przemyślenie przed odpowiedzią.

Stosuj gdy zadanie jest złożone, analityczne lub wieloetapowe. CoT redukuje błędy logiczne o 20–40%. Pomiń gdy używasz modelu z wbudowanym rozumowaniem.

Szablon A

Przemyśl problem krok po kroku, zanim podasz odpowiedź.

Szablon B

Najpierw zidentyfikuj kluczowe założenia. Potem odpowiedz.

Szablon C

Pokaż tok myślenia w <myślenie>, finalną odpowiedź w <odpowiedź>.

Szablon D

Jeśli masz wątpliwości co do faktów, napisz to wprost zamiast zgadywać.

§01b

Specyfika Modeli

Każdy model reaguje inaczej na tę samą instrukcję. Poniższe wskazówki oparte na oficjalnej dokumentacji i testach 2025–2026.

CLAUDE 4.x

Używaj tagów XML do strukturyzacji - działają lepiej niż Markdown i listy numerowane.

Owijaj przykłady w <example> tagi. Odwołuj się: „korzystając z <context>...”

Instrukcje wykonywane dosłownie - jeśli czegoś nie poprosisz, nie dostaniesz.

CRITICAL! / YOU MUST / NIGDY!!! → spokojne, bezpośrednie sformułowania. Agresywny język aktywuje nadmiarowe filtry.

Extended Thinking: tryb adaptive - pozwól modelowi zdecydować kiedy potrzebuje głębszego rozumowania.

GPT-5

GPT-5 to system routingowy - „Przemyśl to dokładnie” przełącza na model rozumujący.

„Think step by step” przy rozumowaniu może szkodzić - model już to robi. OpenAI docs ostrzegają.

Prompty konwersacyjne, naturalne - GPT-5 świetnie inferuje intencje z minimalnego kontekstu.

Dla produkcji: pinuj konkretny snapshot (np. gpt-5-2025-08-07) - zachowanie routera zmienia się.

Zero-shot przed few-shot - sprawdź najpierw bez przykładów.

GEMINI

Preferuje prompty krótkie i bezpośrednie - krócej niż Claude lub GPT.

Zero-shot nie jest preferowany (Google whitepaper) - zawsze dołączaj few-shot.

Okno 2M tokenów: placement kluczowy - instrukcje specyficzne na końcu, po danych.

Problem „lost in the middle” tu szczególnie wyraźny - dane w środku obsługiwane znacznie gorzej.

Gemini Thinking Mode → pomiń explicit CoT.

§02

Wzór Gotowego Prompta

Rola + Kontekst

ROLA: Jesteś [stanowisko] z [X lat] dow. w [branży]. Piszesz dla [odbiorcy] w stylu [zwięzłym / formalnym]. KONTEKST: [Opis sytuacji, danych, problemu] wymagane - nie generuj bez: - [Parametr 1]: ___ - [Parametr N]: ___ PRZED ROZP.: Brakuje danych? ZATRZYMAJ SIĘ i zapytaj.

Zadanie + Format

ZADANIE: [Aktywny czasownik] + [cel w 1 zdaniu]. FORMAT: - Długość: [maks. 300 słów] - Struktura: [wstęp→CTA] - Styl: [bez emoji, po polsku] - Na krok: min. 1 przykład SUCCESS CRITERIA: [Lista must-have]

Przykłady + Ograniczenia

PRZYKŁADY: Wejście: [przykład 1] Oczekiwane: [wynik 1] OGRANICZENIA: - Używaj wyłącznie [X] - Pisz w stylu [Y] - Tylko fakty z kontekstu - Na końcu: 3 błędy do unikania

CoT + Self-Eval

ROZUMOWANIE: Przemyśl krok po kroku. Pokaż w <myślenie>, finalną odpowiedź w <odpowiedź>. PRZED ODDANIEM: ☐ Format zgodny ☐ Kryteria spełnione ☐ Niepewne → [?] ☐ Kroki actionable // pomiń CoT jeśli model // ma wbudowane rozumowanie

Typ zadania	Wymagane warstwy	Tagi
Proste pytanie / tłumaczenie	Zadanie + Format	ZadanieFormat
Zadanie kreatywne	Rola + Zadanie + Format + Przykłady	RolaZadanieFormatPrzykłady
Analiza / raport	Kontekst + Zadanie + Format + CoT	KontekstZadanieFormatCoT
Zadanie złożone / wieloetapowe	Wszystkie 7 warstw + Self-Eval	WszystkieCoTSelf-Eval
System prompt agenta AI	Wszystkie + iteracja + context assembly	WszystkieCoTContext Eng.
Zadanie wysokiej stawki	Wszystkie 7 + Self-Eval + Success Criteria	WszystkieSelf-EvalSuccess Criteria

§04

Najćzęstsze Błędy

⚠️

„Pomóż mi z marketingiem”

Za szerokie zadanie

„Napisz 3 warianty subject line e-maila na Black Friday dla SaaS B2B”

Jedno rozmyłe zadanie = rozmyta odpowiedź. Aktywny czasownik + precyzyjny cel w jednym zdaniu.

⚠️

Brak jakiegokolwiek kontekstu

Model zgaduje

Dodaj: dane produktu, odbiorcę, historię problemu, ograniczenia

Bez kontekstu model wypełnia luki własnymi założeniami. Plan wygląda OK, ale pasuje do fikcji.

⚠️

„Bądź kreatywny”

Niejednoznaczna instrukcja

Podaj przykład stylu - wejście → oczekiwane wyjście

Przykłady kalibrują styl precyzyjniej niż jakikolwiek opis słowny. Pokaż, nie opisuj.

⚠️

Dwa cele w jednym prompcie

Rozmyta odpowiedź

Jeden prompt = jeden cel. Rozdziel na dwa osobne prompty.

Model obsługuje oba cele powierzchownie. Separacja daje głębię każdemu.

⚠️

Używanie negacji (NIE rób X)

Pink Elephant

Przeformułuj pozytywnie: „Używaj wyłącznie X”

Negacje aktywują to, czego chcesz uniknąć. Pozytywne sformułowania kierują wprost do celu.

⚠️

Plan bez sekcji „czego nie robić”

Mapa bez moczarów

Na końcu: 3 najćzęstsze błędy + wyjaśnienie kosztów

Można wykonać wszystkie właściwe działania i stracić budżet na jeden nieplanowany zły ruch.

Slowniczek pojec

LLM

Large Language Model - duzy model jezykowy (np. Claude, GPT-5, Gemini). Siec neuronowa trenowana na ogromnych zbiorach tekstu, zdolna do generowania i rozumienia jezyka naturalnego.

Chain-of-Thought

Technika promtowania, ktora sklania model do rozpisania toku rozumowania krok po kroku przed podaniem finalnej odpowiedzi. Redukuje bledy logiczne o 20-40%.

LangChain

Popularny framework open-source do budowania aplikacji opartych na LLM. Oferuje gotowe komponenty do lacenia modeli, narzedzi, pamieci i zrodel danych w jeden przeplywy.

Lost in the Middle

Zjawisko badawcze (Liu et al. 2024): model znacznie gorzej przetwarza informacje zakopane w srodku dlugiego kontekstu. Uwaga ma ksztalt litery U - najlepsza na poczatku i koncu.

Gemini Thinking Mode

Tryb rozumowania modeli Gemini (Google), w ktorym model samodzielnie przetwarza problem przed udzieleniem odpowiedzi. Dziala analogicznie do Extended Thinking w Claude. Nie wymaga recznego CoT.

Extended Thinking

Tryb w modelach Claude (Anthropic), ktory pozwala modelowi na wewnetrzne rozumowanie przed odpowiedzia. W trybie adaptive model sam decyduje kiedy potrzebuje glebszego namyslu.

scoring rubric

Szczegolowa skala oceny odpowiedzi (np. 0-5 punktow w kilku wymiarach: poprawnosc, kompletnosc, klarownosc). Dolaczona do prompta sklania model do samodzielnej weryfikacji outputu.

Self-Eval Block

Fragment prompta nakazujacy modelowi sprawdzenie wlasnej odpowiedzi przed jej oddaniem. Aktywuje inne sciezki uwagi niz generowanie - skutecznie eliminuje bledy formatowe i merytoryczne.

success criteria

Kryteria akceptacji - lista warunkow, ktore musi spelnic odpowiedz, zeby uznac zadanie za wykonane. Definiowane przed napisaniem promptu: co musi byc, a czego nie moze byc w outputcie.

CoT

Skrot od Chain-of-Thought. Instrukcja lub technika sklaniajaca model do rozpisania krokow rozumowania. Stosuj przy zadaniach zlozonych; pominij gdy model ma wbudowane rozumowanie.

Efektywny Prompt

Co się zmieniło w 2026

Reguły Uwagi - nowe odkrycia

Problem „Lost in the Middle”

Pink Elephant - negacje szkodzą

Długość prompta - mniej = lepiej

Success Criteria - standard 2026

7 Warstw Skutecznego Prompta

Rola / Persona

Kontekst

Zadanie

Format Wyjscia

Przyklady

Ograniczenia

6a. Weryfikacja Regulacyjna

6b. Kalibracja do Skali

6c. Sekcja „Czego nie robić”

Chain-of-Thought

Specyfika Modeli

Self-Eval Block - Nowość 2026

Wzór Gotowego Prompta

Skróty Sytuacyjne

Najćzęstsze Błędy

Checklist Przed Wysłaniem