Blog JSystems - uwalniamy wiedzę!
Blog JSystems - uwalniamy wiedzę!
Seria Claude Code · JSystemsWyobraź sobie, że ten sam człowiek potrafi odpowiedzieć na pytanie odruchowo, w pół sekundy - albo usiąść, rozpisać warianty na kartce, sprawdzić własne założenia i dopiero wtedy się odezwać. Z Claude jest dokładnie tak. To nie kwestia "lepszego" czy "gorszego" modelu. To jedno pokrętło, którym mówisz: myśl płycej, bo się spieszę albo zwolnij, to jest trudne, daj z siebie wszystko.
To pokrętło nazywa się effort. Większość ludzi go nie rusza i przepala tokeny na trywialnych zadaniach albo dostaje płytkie odpowiedzi na trudnych - bo nie wie, że może nim sterować. Ten artykuł to zmienia: poznasz wszystkie poziomy, ciekawostki, których nie ma w dokumentacji "między wierszami", i konkretne reguły kiedy którego użyć.
Z tego artykułu dowiesz się:
Effort to ustawienie, które kontroluje, jak chętnie Claude wydaje tokeny przy rozwiązywaniu zadania. Mówiąc prościej: jak głęboko rozumuje, zanim się odezwie. Niski effort to szybka, oszczędna odpowiedź. Wysoki to model, który generuje wewnętrzne ciągi rozumowania, analizuje problem z kilku stron, weryfikuje własne tezy, a gdy wykryje sprzeczność w swoim toku myślenia - cofa się i próbuje inaczej.
Najważniejsze, co odróżnia effort od wyboru modelu: to wciąż ten sam model. Nie schodzisz na "głupszą" wersję, żeby było taniej. Bierzesz tę samą inteligencję i decydujesz, ile wysiłku ma w nią włożyć przy tym konkretnym zapytaniu.
Przejdźmy przez nie od najlżejszego do najcięższego. Każdy ma swoją naturalną "strefę wygranej".
/effort - otworzy się interaktywny suwak z tymi samymi poziomami, które opisujemy niżej (strzałki lewo/prawo wybierają, Enter zatwierdza). Możesz też ustawić poziom jednym poleceniem, np. /effort max. Zrzuty przy każdym poziomie pochodzą właśnie z tego suwaka; pełną listę sposobów (API, flaga startowa, plik ustawień) zebraliśmy w sekcji Jak ustawić effort w Claude Code.Jeśli wolisz klikać zamiast wpisywać komendy, w aplikacji desktopowej Claude (na Linuksie to „Claude for Linux", tak samo działa to na Windowsie i macOS) masz dokładnie ten sam suwak pod ręką. Siedzi na dole okna, po prawej stronie paska promptu, tuż obok nazwy modelu. Kliknij etykietę bieżącego poziomu (np. High), a rozwinie się poziomy suwak: z lewej „Faster" (szybciej, taniej), z prawej „Smarter" (głębiej, dokładniej), a po drodze te same poziomy co w konsoli - low, medium, high, xhigh, max i ultracode. Przeciągasz uchwyt w lewo albo w prawo.




low - "odpowiedz i lecimy dalej"
Najbardziej oszczędny tryb. Duże oszczędności tokenów i czasu kosztem części zdolności. Na prostych problemach Claude często w ogóle pomija etap myślenia i odpowiada wprost.
Kiedy warto: klasyfikacja, proste wyszukiwania, masowe przetwarzanie tysięcy zapytań, czat o niskiej stawce, a także subagenci wykonujący wąsko zakrojoną robotę. Wszędzie tam, gdzie marginalna poprawa jakości nie jest warta dodatkowego czasu i kosztu.

/effort ustawiony na low.medium - rozsądny środek
Zbalansowane podejście: solidne wyniki przy umiarkowanych oszczędnościach. To naturalny "drop-in" dla przeciętnego przepływu pracy, w którym chcesz dobrych rezultatów, ale zależy ci na rachunku za tokeny.
Kiedy warto: zadania agentowe wymagające równowagi szybkości, kosztu i jakości; generowanie kodu i przepływy mocno korzystające z narzędzi, gdy nie potrzebujesz pełnej głębi. Dla jednego z modeli Sonnet to wręcz rekomendowany codzienny wybór do większości zadań — najlepszy stosunek jakości do kosztu (choć technicznym poziomem domyślnym i tam pozostaje high).

/effort ustawiony na medium.high - domyślny, i nie bez powodu
Wysoka zdolność rozumowania. To poziom domyślny - a ustawienie go ręcznie daje dokładnie ten sam efekt co niepodanie parametru w ogóle. Na tym i wyższych poziomach Claude prawie zawsze myśli przed odpowiedzią.
Kiedy warto: złożone rozumowanie, niuansowa analiza, trudniejsze problemy programistyczne - wszędzie, gdzie jakość liczy się bardziej niż szybkość i koszt. Dla wielu zadań to po prostu właściwy punkt startu.

/effort ustawiony na high (poziom domyślny).xhigh - tryb maratonu
Rozszerzona zdolność do pracy "długodystansowej". Projektowany pod zadania, które ciągną się długo - z budżetami tokenów liczonymi w milionach i czasem pracy przekraczającym pół godziny. Spodziewaj się zauważalnie wyższego zużycia tokenów niż na high.
Kiedy warto: zaawansowane kodowanie i złożona praca agentowa - wielokrotne wywoływanie narzędzi, drobiazgowe przeszukiwanie sieci i baz wiedzy, eksploracja dużego repozytorium. To rekomendowany punkt startu dla pracy z kodem na najnowszych modelach Opus. Dostępny tylko na nich.

/effort ustawiony na xhigh.max - bez hamulców
Absolutne maksimum możliwości, bez ograniczeń na wydatek tokenów. Najgłębsze rozumowanie i najbardziej drobiazgowa analiza, na jaką model stać.
Kiedy warto: naprawdę graniczne, otwarte problemy, gdzie nie masz budżetowych ograniczeń, a każdy procent jakości się liczy. Uwaga - to nie jest "tryb na co dzień" (więcej o tym za chwilę).

/effort na max - narzędzie samo ostrzega przed nadmiernym zużyciem tokenów.ultracode - bonus tylko w Claude Code
Dostępny przez /effort (pojawia się w menu obok low/medium/high/xhigh/max), ale działa inaczej niż pozostałe poziomy — nie kontroluje budżetu tokenów myślenia, lecz uruchamia wieloagentową orkiestrację. Claude rozbija robotę na zespół agentów działających równolegle, przy czym sam model pracuje na poziomie xhigh.
Kiedy warto: duże, wieloetapowe zadania (migracje, audyty całego repozytorium, szeroki research), gdzie chcesz maksymalnej dokładności i nie liczysz tokenów. Obowiązuje tylko w bieżącej sesji.

/effort na ultracode - jako jedyny poziom podświetla się kolorowym efektem (w terminalu pulsuje animacją); podpis „xhigh + workflows".| Poziom | Charakter | Typowe zastosowanie |
|---|---|---|
| low | Najszybszy, najtańszy | Klasyfikacja, masowe zapytania, subagenci, czat o niskiej stawce |
| medium | Balans kosztu i jakości | Codzienne przepływy agentowe, generowanie kodu, praca z narzędziami |
| high | Domyślny, wysoka jakość | Złożone rozumowanie, trudniejszy kod, analiza wymagająca niuansu |
| xhigh | Praca długodystansowa | Duże zadania kodowe i agentowe, eksploracja repo, intensywne narzędzia |
| max | Maksimum, bez limitu tokenów | Graniczne, otwarte problemy - rezerwa, nie codzienność |
| ultracode | xhigh + zespół agentów (Claude Code) | Migracje, audyty całego repo, szeroki research wieloetapowy |
Chcesz wycisnąć z Claude maksimum w realnej pracy z kodem i agentami? --> Szkolenie Claude Code z terminem gwarantowanym - 3 dni warsztatów z trenerem.
Tu jest niuans, na którym wielu się potyka. Effort nie jest sztywnym budżetem tokenów. To sygnał behawioralny - opis nastawienia. Na niskim effort Claude i tak pomyśli, jeśli trafi na wystarczająco trudny problem - po prostu pomyśli mniej, niż zrobiłby to na wyższym poziomie przy tym samym zadaniu.
Praktyczny wniosek: jeśli widzisz płytkie rozumowanie na trudnym zadaniu, podnieś effort, zamiast obudowywać prompt sztuczkami. A jeśli z jakiegoś powodu musisz zostać na niskim poziomie (np. zależy ci na czasie reakcji), dorzuć do promptu wyraźną wskazówkę w stylu: "To zadanie wymaga wieloetapowego rozumowania. Przemyśl je dokładnie, zanim odpowiesz."
Naturalny odruch brzmi: "skoro mogę dać max, to dawajmy max na wszystko". To błąd, który kosztuje pieniądze, a czasem nawet jakość. Na większości zadań max dokłada znaczący koszt przy stosunkowo małym przyroście jakości. Co gorsza, na zadaniach o sztywnej strukturze (np. generowanie ściśle określonego formatu wyjścia) potrafi prowadzić do nadmyślenia - model "kombinuje" tam, gdzie wystarczyło zrobić prosto.
Dlatego rekomendacja jest taka: zacznij od poziomu adekwatnego do zadania (dla kodu i pracy agentowej - xhigh na najnowszych Opusach, dla reszty - high), a po max sięgaj dopiero, gdy twoje własne testy pokażą, że jest jeszcze zysk do wzięcia. Schodź na medium albo low, gdy zmierzysz, że niższy poziom utrzymuje jakość.
W API effort podaje się jako osobny parametr najwyższego poziomu (nie jako zagnieżdżony obiekt). Jedna linijka i tyle:
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=4096,
messages=[{"role": "user", "content": "Porównaj architekturę monolitu i mikroserwisów"}],
effort="medium", # low | medium | high | xhigh | max
)
print(response.content[0].text)
Brak nagłówka beta, brak osobnej konfiguracji - parametr jest dostępny od ręki na wszystkich wspieranych modelach. Domyślnie i tak dostajesz high, więc ustawiasz go wtedy, gdy chcesz coś innego.
max_tokens, żeby model miał miejsce i na myślenie, i na działanie.
W narzędziu Claude Code (terminalowy asystent kodujący) masz to wygodnie pod ręką. Najprościej - komenda /effort:
/effort # otwiera interaktywny suwak
/effort medium # ustawia od razu wybrany poziom
/effort auto # wraca do poziomu domyślnego dla modelu

/effort, a narzędzie podpowiada komendę („Set effort level for model usage"). Samo /effort otwiera suwak, a np. /effort max ustawia poziom od razu.Poza komendą masz kilka innych dróg, ułożonych według priorytetu (zmienna środowiskowa wygrywa z resztą):
/model, strzałki lewo-prawo),--effort xhigh (na jedną sesję),CLAUDE_CODE_EFFORT_LEVEL,effortLevel w pliku ustawień (na stałe),effort we frontmatterze konkretnej umiejętności (skill) lub subagenta - nadpisuje poziom sesji, gdy ten skill/subagent działa.
Tu kryje się jedna z najfajniejszych ciekawostek. W Claude Code możesz wpisać gdziekolwiek w prompcie słowo ultrathink - i poprosić o głębsze rozumowanie tylko w tej jednej turze, bez zmieniania ustawienia effort dla całej sesji. Narzędzie rozpoznaje to słowo kluczowe i dorzuca odpowiednią instrukcję w kontekście.
Różnica jest więc taka:
think, think hard, think harder i ultrathink — każde z nich daje inny budżet tokenów na myślenie (ultrathink = najgłębszy). Działają w tej jednej turze, nie zmieniając ustawienia effort dla całej sesji. Jeśli chcesz realnie więcej myślenia na stałe w każdej turze, użyj effort.
Nie każdy model rozumie każdy poziom. Skrajne tryby (xhigh, max) to domena najmocniejszych modeli. Jeśli ustawisz poziom, którego dany model nie obsługuje, narzędzie zejdzie do najwyższego dostępnego poniżej (np. xhigh zadziała jak high na modelu bez xhigh). Poniżej zdjęcie stanu - traktuj je jako migawkę, bo lista modeli rośnie:
| Klasa modelu | Dostępne poziomy | Domyślny |
|---|---|---|
| Najnowsze Opus (generacja 4.8; 4.7 — niezweryfikowana) | low, medium, high, xhigh, max | high (na jednym z nich xhigh) |
| Poprzednia generacja Opus / Sonnet (4.6) | low, medium, high, max | high |
Stan na czerwiec 2026. Sama nazwa poziomu nie znaczy tej samej "ilości" myślenia na różnych modelach - skala jest kalibrowana osobno dla każdego z nich.
Zauważ, że w menu /effort widać szóstą pozycję - ultracode - której w tej tabeli celowo nie ma. To nie jest poziom modelu, lecz tryb samego Claude Code: nie ustawia budżetu myślenia, tylko uruchamia wieloagentową orkiestrację (model pracuje na xhigh i rozdziela pracę między równoległych agentów). Działa więc niezależnie od modelu - wszędzie tam, gdzie dostępny jest xhigh.
| Błąd | Efekt | Fix |
|---|---|---|
| max na wszystko "dla pewności" | Wyższy koszt, czasem nadmyślenie i gorszy wynik | Start od high/xhigh, max tylko gdy testy pokażą zysk |
| low na trudnym, wieloetapowym zadaniu | Płytkie rozumowanie, urwane wnioski | Podnieś effort, a nie obudowuj promptu sztuczkami |
| xhigh/max bez podniesienia max_tokens | Model nie ma miejsca na myślenie i działanie | Ustaw hojny limit (np. start od 64k tokenów) |
| Poleganie wyłącznie na słowach kluczowych (think/ultrathink) zamiast effort | Myślenie głębsze tylko w jednej turze, nie na stałe | Ustaw effort dla całej sesji; słów kluczowych używaj do jednorazowych zastrzyków |
| Ten sam effort dla całego ruchu produkcyjnego | Przepalanie na prostym, oszczędzanie na trudnym | Dynamiczny effort - dobierany do złożoności zapytania |
Jeśli masz zapamiętać jedno zdanie, niech będzie to: ustawiaj effort świadomie, zamiast jechać na domyślnym dla wszystkiego. Praktyczny algorytm:
Reszta to mierzenie. Effort to nie magia - to świadomy kompromis między jakością, czasem i rachunkiem za tokeny, który dostroisz na własnych zadaniach w kilka minut.
Sterowanie effortem to różnica między "używam AI" a "wyciskam z AI maksimum".
Jeden parametr potrafi obniżyć rachunek za tokeny o połowę na rutynowych zadaniach - i jednocześnie wyciągnąć model na zupełnie inny poziom, gdy problem jest naprawdę trudny. To powtarzalna umiejętność, nie talent. A jak każdą umiejętność, najszybciej opanujesz ją przy kimś, kto już przerobił to na realnych projektach.
Komentarze (0)
Brak komentarzy...