Blog JSystems - uwalniamy wiedzę!

Szukaj

AI i automatyzacja AI dla programistów 2026-07-15

Poziomy effort w Claude - low, medium, high, xhigh i max (kiedy używać którego)

Seria Claude Code · JSystems

Wyobraź sobie, że ten sam człowiek potrafi odpowiedzieć na pytanie odruchowo, w pół sekundy - albo usiąść, rozpisać warianty na kartce, sprawdzić własne założenia i dopiero wtedy się odezwać. Z Claude jest dokładnie tak. To nie kwestia "lepszego" czy "gorszego" modelu. To jedno pokrętło, którym mówisz: myśl płycej, bo się spieszę albo zwolnij, to jest trudne, daj z siebie wszystko.

To pokrętło nazywa się effort. Większość ludzi go nie rusza i przepala tokeny na trywialnych zadaniach albo dostaje płytkie odpowiedzi na trudnych - bo nie wie, że może nim sterować. Ten artykuł to zmienia: poznasz wszystkie poziomy, ciekawostki, których nie ma w dokumentacji "między wierszami", i konkretne reguły kiedy którego użyć.

Z tego artykułu dowiesz się:

Czym naprawdę jest effort i dlaczego dotyczy nie tylko "myślenia"
Wszystkie poziomy - low, medium, high, xhigh, max i ultracode - z opisem i sytuacją w której wygrywają
Kiedy wyższy effort szkodzi (tak, to się zdarza)
Jak ustawić effort w API i w Claude Code - z gotowym kodem
Czym effort różni się od magicznego słowa "ultrathink"

Czym jest effort - jeden model, regulowana głębia

Effort to ustawienie, które kontroluje, jak chętnie Claude wydaje tokeny przy rozwiązywaniu zadania. Mówiąc prościej: jak głęboko rozumuje, zanim się odezwie. Niski effort to szybka, oszczędna odpowiedź. Wysoki to model, który generuje wewnętrzne ciągi rozumowania, analizuje problem z kilku stron, weryfikuje własne tezy, a gdy wykryje sprzeczność w swoim toku myślenia - cofa się i próbuje inaczej.

Najważniejsze, co odróżnia effort od wyboru modelu: to wciąż ten sam model. Nie schodzisz na "głupszą" wersję, żeby było taniej. Bierzesz tę samą inteligencję i decydujesz, ile wysiłku ma w nią włożyć przy tym konkretnym zapytaniu.

Dla początkujących: "Token" to najmniejszy kawałek tekstu, którym operuje model - mniej więcej kawałek słowa. Im więcej tokenów model wygeneruje (także tych "w myślach", których nie widzisz), tym dłużej trwa odpowiedź i tym więcej kosztuje. Effort to w praktyce regulacja: ile tokenów modelowi wolno przepalić, żeby dojść do dobrej odpowiedzi.

Ciekawostka: effort dotyczy wszystkich tokenów odpowiedzi - nie tylko ukrytego "myślenia". Obejmuje też tekst, który widzisz, oraz wywołania narzędzi (tool calls). Dlatego na niskim effort Claude nie tylko mniej myśli - robi też mniej kroków: łączy kilka operacji w jedno wywołanie narzędzia, mniej tłumaczy, przechodzi prosto do akcji. Warto rozdzielić dwie rzeczy: samo "myślenie" (ukryty tok rozumowania) to osobny przełącznik — można je włączyć (wtedy model przed odpowiedzią rozumuje na boku i sam decyduje, ile) albo w ogóle wyłączyć (odpowiada od razu, bez tego etapu). Effort to drugie, niezależne pokrętło. Dlatego effort działa nawet przy całkowicie wyłączonym "myśleniu" — steruje wtedy resztą odpowiedzi: ile tekstu napisze i ile kroków wykona.

Pięć poziomów (plus jeden bonus w Claude Code)

Przejdźmy przez nie od najlżejszego do najcięższego. Każdy ma swoją naturalną "strefę wygranej".

Chcesz od razu potestować? Nie musisz czekać do końca artykułu. W Claude Code wpisz w oknie promptu komendę /effort - otworzy się interaktywny suwak z tymi samymi poziomami, które opisujemy niżej (strzałki lewo/prawo wybierają, Enter zatwierdza). Możesz też ustawić poziom jednym poleceniem, np. /effort max. Zrzuty przy każdym poziomie pochodzą właśnie z tego suwaka; pełną listę sposobów (API, flaga startowa, plik ustawień) zebraliśmy w sekcji Jak ustawić effort w Claude Code.

A gdzie zmienić effort w aplikacji desktopowej?

Jeśli wolisz klikać zamiast wpisywać komendy, w aplikacji desktopowej Claude (na Linuksie to „Claude for Linux", tak samo działa to na Windowsie i macOS) masz dokładnie ten sam suwak pod ręką. Siedzi na dole okna, po prawej stronie paska promptu, tuż obok nazwy modelu. Kliknij etykietę bieżącego poziomu (np. High), a rozwinie się poziomy suwak: z lewej „Faster" (szybciej, taniej), z prawej „Smarter" (głębiej, dokładniej), a po drodze te same poziomy co w konsoli - low, medium, high, xhigh, max i ultracode. Przeciągasz uchwyt w lewo albo w prawo.

Aplikacja desktopowa Claude - suwak effort na dole okna obok modelu — Aplikacja desktopowa: suwak **effort** jest na dole okna, po prawej, obok nazwy modelu (tu **Opus 4.8**, poziom **High**). To tutaj zmieniasz tryb.

Suwak effort w aplikacji desktopowej ustawiony na low — Po kliknięciu rozwija się suwak od „Faster" do „Smarter". Tu przeciągnięty na **low** (lewy koniec, „Faster").

Suwak effort w aplikacji desktopowej ustawiony na high — Ten sam suwak na **high** - poziom domyślny.

Suwak effort w aplikacji desktopowej ustawiony na ultracode — I na **ultracode** (prawy koniec, „Smarter") - najwyższy tryb, tak jak w konsoli wyróżniony kolorem.

low - "odpowiedz i lecimy dalej"

Najbardziej oszczędny tryb. Duże oszczędności tokenów i czasu kosztem części zdolności. Na prostych problemach Claude często w ogóle pomija etap myślenia i odpowiada wprost.

Kiedy warto: klasyfikacja, proste wyszukiwania, masowe przetwarzanie tysięcy zapytań, czat o niskiej stawce, a także subagenci wykonujący wąsko zakrojoną robotę. Wszędzie tam, gdzie marginalna poprawa jakości nie jest warta dodatkowego czasu i kosztu.

Menu /effort w Claude Code ustawione na poziom low — Realny zrzut z Claude Code: suwak `/effort` ustawiony na **low**.

medium - rozsądny środek

Zbalansowane podejście: solidne wyniki przy umiarkowanych oszczędnościach. To naturalny "drop-in" dla przeciętnego przepływu pracy, w którym chcesz dobrych rezultatów, ale zależy ci na rachunku za tokeny.

Kiedy warto: zadania agentowe wymagające równowagi szybkości, kosztu i jakości; generowanie kodu i przepływy mocno korzystające z narzędzi, gdy nie potrzebujesz pełnej głębi. Dla jednego z modeli Sonnet to wręcz rekomendowany codzienny wybór do większości zadań — najlepszy stosunek jakości do kosztu (choć technicznym poziomem domyślnym i tam pozostaje high).

Menu /effort w Claude Code ustawione na poziom medium — Realny zrzut z Claude Code: suwak `/effort` ustawiony na **medium**.

high - domyślny, i nie bez powodu

Wysoka zdolność rozumowania. To poziom domyślny - a ustawienie go ręcznie daje dokładnie ten sam efekt co niepodanie parametru w ogóle. Na tym i wyższych poziomach Claude prawie zawsze myśli przed odpowiedzią.

Kiedy warto: złożone rozumowanie, niuansowa analiza, trudniejsze problemy programistyczne - wszędzie, gdzie jakość liczy się bardziej niż szybkość i koszt. Dla wielu zadań to po prostu właściwy punkt startu.

Menu /effort w Claude Code ustawione na poziom high — Realny zrzut z Claude Code: suwak `/effort` ustawiony na **high** (poziom domyślny).

xhigh - tryb maratonu

Rozszerzona zdolność do pracy "długodystansowej". Projektowany pod zadania, które ciągną się długo - z budżetami tokenów liczonymi w milionach i czasem pracy przekraczającym pół godziny. Spodziewaj się zauważalnie wyższego zużycia tokenów niż na high.

Kiedy warto: zaawansowane kodowanie i złożona praca agentowa - wielokrotne wywoływanie narzędzi, drobiazgowe przeszukiwanie sieci i baz wiedzy, eksploracja dużego repozytorium. To rekomendowany punkt startu dla pracy z kodem na najnowszych modelach Opus. Dostępny tylko na nich.

Menu /effort w Claude Code ustawione na poziom xhigh — Realny zrzut z Claude Code: suwak `/effort` ustawiony na **xhigh**.

max - bez hamulców

Absolutne maksimum możliwości, bez ograniczeń na wydatek tokenów. Najgłębsze rozumowanie i najbardziej drobiazgowa analiza, na jaką model stać.

Kiedy warto: naprawdę graniczne, otwarte problemy, gdzie nie masz budżetowych ograniczeń, a każdy procent jakości się liczy. Uwaga - to nie jest "tryb na co dzień" (więcej o tym za chwilę).

Menu /effort w Claude Code ustawione na poziom max z ostrzeżeniem — Realny zrzut z Claude Code: suwak `/effort` na **max** - narzędzie samo ostrzega przed nadmiernym zużyciem tokenów.

ultracode - bonus tylko w Claude Code

Dostępny przez /effort (pojawia się w menu obok low/medium/high/xhigh/max), ale działa inaczej niż pozostałe poziomy — nie kontroluje budżetu tokenów myślenia, lecz uruchamia wieloagentową orkiestrację. Claude rozbija robotę na zespół agentów działających równolegle, przy czym sam model pracuje na poziomie xhigh.

Kiedy warto: duże, wieloetapowe zadania (migracje, audyty całego repozytorium, szeroki research), gdzie chcesz maksymalnej dokładności i nie liczysz tokenów. Obowiązuje tylko w bieżącej sesji.

Suwak /effort na ultracode w Claude Code z kolorowym efektem — Realny zrzut z Claude Code: suwak `/effort` na **ultracode** - jako jedyny poziom podświetla się kolorowym efektem (w terminalu pulsuje animacją); podpis „xhigh + workflows".

Skrót: który poziom do czego

Poziom	Charakter	Typowe zastosowanie
low	Najszybszy, najtańszy	Klasyfikacja, masowe zapytania, subagenci, czat o niskiej stawce
medium	Balans kosztu i jakości	Codzienne przepływy agentowe, generowanie kodu, praca z narzędziami
high	Domyślny, wysoka jakość	Złożone rozumowanie, trudniejszy kod, analiza wymagająca niuansu
xhigh	Praca długodystansowa	Duże zadania kodowe i agentowe, eksploracja repo, intensywne narzędzia
max	Maksimum, bez limitu tokenów	Graniczne, otwarte problemy - rezerwa, nie codzienność
ultracode	xhigh + zespół agentów (Claude Code)	Migracje, audyty całego repo, szeroki research wieloetapowy

Chcesz wycisnąć z Claude maksimum w realnej pracy z kodem i agentami? --> Szkolenie Claude Code z terminem gwarantowanym - 3 dni warsztatów z trenerem.

Effort to sygnał, nie twardy limit

Tu jest niuans, na którym wielu się potyka. Effort nie jest sztywnym budżetem tokenów. To sygnał behawioralny - opis nastawienia. Na niskim effort Claude i tak pomyśli, jeśli trafi na wystarczająco trudny problem - po prostu pomyśli mniej, niż zrobiłby to na wyższym poziomie przy tym samym zadaniu.

Praktyczny wniosek: jeśli widzisz płytkie rozumowanie na trudnym zadaniu, podnieś effort, zamiast obudowywać prompt sztuczkami. A jeśli z jakiegoś powodu musisz zostać na niskim poziomie (np. zależy ci na czasie reakcji), dorzuć do promptu wyraźną wskazówkę w stylu: "To zadanie wymaga wieloetapowego rozumowania. Przemyśl je dokładnie, zanim odpowiesz."

Ciekawostka: najnowsze modele Opus respektują niskie poziomy ściślej niż starsze generacje. Na low i medium model zawęża się do tego, o co dokładnie poproszono, zamiast robić "coś ekstra ponad zadanie". To świetne do przewidywalnych, wąskich zadań - ale właśnie dlatego na trudnym problemie low potrafi być zaskakująco oszczędne w myśleniu.

Pułapka: więcej nie zawsze znaczy lepiej

Naturalny odruch brzmi: "skoro mogę dać max, to dawajmy max na wszystko". To błąd, który kosztuje pieniądze, a czasem nawet jakość. Na większości zadań max dokłada znaczący koszt przy stosunkowo małym przyroście jakości. Co gorsza, na zadaniach o sztywnej strukturze (np. generowanie ściśle określonego formatu wyjścia) potrafi prowadzić do nadmyślenia - model "kombinuje" tam, gdzie wystarczyło zrobić prosto.

Dlatego rekomendacja jest taka: zacznij od poziomu adekwatnego do zadania (dla kodu i pracy agentowej - xhigh na najnowszych Opusach, dla reszty - high), a po max sięgaj dopiero, gdy twoje własne testy pokażą, że jest jeszcze zysk do wzięcia. Schodź na medium albo low, gdy zmierzysz, że niższy poziom utrzymuje jakość.

Jak ustawić effort w API

W API effort podaje się jako osobny parametr najwyższego poziomu (nie jako zagnieżdżony obiekt). Jedna linijka i tyle:

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Porównaj architekturę monolitu i mikroserwisów"}],
    effort="medium",  # low | medium | high | xhigh | max
)

print(response.content[0].text)

Brak nagłówka beta, brak osobnej konfiguracji - parametr jest dostępny od ręki na wszystkich wspieranych modelach. Domyślnie i tak dostajesz high, więc ustawiasz go wtedy, gdy chcesz coś innego.

Dla początkujących: w nowszych modelach effort zastąpił starszy sposób sterowania głębią myślenia (ręczne ustawianie "budżetu tokenów na myślenie"). Dziś rekomendowane podejście to effort razem z tzw. myśleniem adaptacyjnym - model sam decyduje, czy i ile pomyśleć na danym kroku, a effort mówi mu jak bardzo ma być w tym zaangażowany. Gdy pracujesz na najwyższych poziomach, ustaw też hojny limit max_tokens, żeby model miał miejsce i na myślenie, i na działanie.

Jak ustawić effort w Claude Code

W narzędziu Claude Code (terminalowy asystent kodujący) masz to wygodnie pod ręką. Najprościej - komenda /effort:

/effort              # otwiera interaktywny suwak
/effort medium       # ustawia od razu wybrany poziom
/effort auto         # wraca do poziomu domyślnego dla modelu

Wpisanie komendy /effort w Claude Code z podpowiedzią — Realny zrzut z Claude Code: wpisujesz w oknie promptu `/effort`, a narzędzie podpowiada komendę („Set effort level for model usage"). Samo `/effort` otwiera suwak, a np. `/effort max` ustawia poziom od razu.

Poza komendą masz kilka innych dróg, ułożonych według priorytetu (zmienna środowiskowa wygrywa z resztą):

suwak effort widoczny przy wyborze modelu (/model, strzałki lewo-prawo),
flaga przy starcie: --effort xhigh (na jedną sesję),
zmienna środowiskowa CLAUDE_CODE_EFFORT_LEVEL,
pole effortLevel w pliku ustawień (na stałe),
pole effort we frontmatterze konkretnej umiejętności (skill) lub subagenta - nadpisuje poziom sesji, gdy ten skill/subagent działa.

Ciekawostka: poziomy low, medium, high i xhigh "zostają" między sesjami - raz ustawione, wracają przy następnym uruchomieniu. Natomiast max obowiązuje tylko w bieżącej sesji. To celowe: najdroższy tryb nie powinien po cichu zostać włączony na zawsze i drenować budżet w tle. Aktualny poziom widać cały czas w nagłówku obok nazwy modelu, np. "with xhigh effort", więc zawsze wiesz, na czym jedziesz.

Nagłówek Claude Code z aktualnym poziomem effort — Realny zrzut z Claude Code: aktualny poziom widać w nagłówku obok modelu - tutaj **with xhigh effort**.

Effort kontra "ultrathink" - dwa różne narzędzia

Tu kryje się jedna z najfajniejszych ciekawostek. W Claude Code możesz wpisać gdziekolwiek w prompcie słowo ultrathink - i poprosić o głębsze rozumowanie tylko w tej jednej turze, bez zmieniania ustawienia effort dla całej sesji. Narzędzie rozpoznaje to słowo kluczowe i dorzuca odpowiednią instrukcję w kontekście.

Różnica jest więc taka:

effort = nastawienie całej sesji, dopóki go nie zmienisz,
ultrathink w prompcie = zastrzyk głębszego myślenia na jedną wiadomość.

Uwaga: Claude Code rozpoznaje kilka słów kluczowych wyzwalających rozszerzone myślenie w danej turze: think, think hard, think harder i ultrathink — każde z nich daje inny budżet tokenów na myślenie (ultrathink = najgłębszy). Działają w tej jednej turze, nie zmieniając ustawienia effort dla całej sesji. Jeśli chcesz realnie więcej myślenia na stałe w każdej turze, użyj effort.

Który poziom na którym modelu

Nie każdy model rozumie każdy poziom. Skrajne tryby (xhigh, max) to domena najmocniejszych modeli. Jeśli ustawisz poziom, którego dany model nie obsługuje, narzędzie zejdzie do najwyższego dostępnego poniżej (np. xhigh zadziała jak high na modelu bez xhigh). Poniżej zdjęcie stanu - traktuj je jako migawkę, bo lista modeli rośnie:

Klasa modelu	Dostępne poziomy	Domyślny
Najnowsze Opus (generacja 4.8; 4.7 — niezweryfikowana)	low, medium, high, xhigh, max	high (na jednym z nich xhigh)
Poprzednia generacja Opus / Sonnet (4.6)	low, medium, high, max	high

Stan na czerwiec 2026. Sama nazwa poziomu nie znaczy tej samej "ilości" myślenia na różnych modelach - skala jest kalibrowana osobno dla każdego z nich.

Zauważ, że w menu /effort widać szóstą pozycję - ultracode - której w tej tabeli celowo nie ma. To nie jest poziom modelu, lecz tryb samego Claude Code: nie ustawia budżetu myślenia, tylko uruchamia wieloagentową orkiestrację (model pracuje na xhigh i rozdziela pracę między równoległych agentów). Działa więc niezależnie od modelu - wszędzie tam, gdzie dostępny jest xhigh.

Najczęstsze błędy przy doborze effort

Błąd	Efekt	Fix
max na wszystko "dla pewności"	Wyższy koszt, czasem nadmyślenie i gorszy wynik	Start od high/xhigh, max tylko gdy testy pokażą zysk
low na trudnym, wieloetapowym zadaniu	Płytkie rozumowanie, urwane wnioski	Podnieś effort, a nie obudowuj promptu sztuczkami
xhigh/max bez podniesienia max_tokens	Model nie ma miejsca na myślenie i działanie	Ustaw hojny limit (np. start od 64k tokenów)
Poleganie wyłącznie na słowach kluczowych (think/ultrathink) zamiast effort	Myślenie głębsze tylko w jednej turze, nie na stałe	Ustaw effort dla całej sesji; słów kluczowych używaj do jednorazowych zastrzyków
Ten sam effort dla całego ruchu produkcyjnego	Przepalanie na prostym, oszczędzanie na trudnym	Dynamiczny effort - dobierany do złożoności zapytania

Prosta reguła na koniec

Jeśli masz zapamiętać jedno zdanie, niech będzie to: ustawiaj effort świadomie, zamiast jechać na domyślnym dla wszystkiego. Praktyczny algorytm:

Proste, masowe, czuły na czas? --> low (albo medium).
Codzienna robota agentowa i kodowa z okiem na koszt? --> medium.
Trudniejsze rozumowanie, jakość ważniejsza od kosztu? --> high (domyślny).
Poważne kodowanie, długa praca agentowa, eksploracja repo? --> xhigh.
Graniczny, otwarty problem bez ograniczeń budżetu? --> max (i tylko gdy testy to uzasadniają).
Duża, wieloetapowa robota w Claude Code, którą chcesz rozbić na zespół agentów? --> ultracode.

Reszta to mierzenie. Effort to nie magia - to świadomy kompromis między jakością, czasem i rachunkiem za tokeny, który dostroisz na własnych zadaniach w kilka minut.

Sterowanie effortem to różnica między "używam AI" a "wyciskam z AI maksimum".

Jeden parametr potrafi obniżyć rachunek za tokeny o połowę na rutynowych zadaniach - i jednocześnie wyciągnąć model na zupełnie inny poziom, gdy problem jest naprawdę trudny. To powtarzalna umiejętność, nie talent. A jak każdą umiejętność, najszybciej opanujesz ją przy kimś, kto już przerobił to na realnych projektach.

Autorzy

Tekst: Redakcja JSystems

Najczęściej zadawane pytania

Czym jest parametr effort w Claude?

Effort to ustawienie, które kontroluje jak chętnie Claude wydaje tokeny na rozwiązanie zadania - czyli jak głęboko rozumuje, zanim odpowie. To jeden model, ale z regulowaną głębią myślenia: od low (szybko i tanio) po max (najwyższa możliwa jakość bez ograniczeń budżetu tokenów).

Jakie są poziomy effort w Claude?

Sześć opcji dostępnych przez /effort w Claude Code: low, medium, high (domyślny), xhigh, max i ultracode. Pierwsze pięć kontroluje budżet tokenów myślenia (extended thinking). Ultracode działa inaczej - nie kontroluje budżetu tokenów, lecz uruchamia wieloagentową orkiestrację: model pracuje na poziomie xhigh i rozbija zadanie na zespół agentów działających równolegle.

Który poziom effort jest domyślny?

Domyślny jest high - i ustawienie effort na high daje dokładnie ten sam efekt co pominięcie parametru. Wyjątkiem jest jeden z modeli Opus, gdzie domyślny jest xhigh. W praktyce: jeśli nic nie ustawisz, Claude rozumuje na wysokim poziomie.

Czy wyższy effort zawsze daje lepszą odpowiedź?

Nie. Na większości zadań max dokłada znaczący koszt przy małym zysku jakości, a na zadaniach o sztywnej strukturze potrafi prowadzić do nadmyślenia (overthinking) i gorszego wyniku. Najwyższy poziom rezerwuj na naprawdę trudne, otwarte problemy i potwierdzaj zysk własnymi testami.

Czym różni się effort od słowa ultrathink w Claude Code?

Effort to ustawienie sesji - obowiązuje aż je zmienisz. Słowo ultrathink wpisane w prompt prosi o głębsze rozumowanie tylko w tej jednej turze, nie zmieniając ustawienia sesji. Claude Code rozpoznaje kilka słów kluczowych wyzwalających rozszerzone myślenie w danej turze: think, think hard, think harder i ultrathink - każde z nich daje inny budżet tokenów na myślenie (ultrathink = najgłębszy).

Komentarze (0)

Musisz być zalogowany by móc dodać komentarz.

Zaloguj się przez Google

Brak komentarzy...

Link skopiowany!