Blog JSystems - uwalniamy wiedzę!

Szukaj
Interaktywny wizualizator algorytmów sortowania w ciemnym motywie: wybór algorytmu, przyciski Losuj i Start, suwaki Prędkość i Rozmiar, liczniki Porównania i Zamiany oraz gradientowe słupki - całość zbudowana przez model Fable 5 z jednego polecenia
Ta aplikacja - interaktywny wizualizator algorytmów sortowania w jednym pliku HTML, z ciemnym motywem, czterema algorytmami, suwakami i licznikami - powstała w całości z jednego polecenia wpisanego do Fable 5. Zrzut z naszego konta na claude.ai.
Polecenie, które ją zbudowało
Zbuduj w jednym pliku HTML (z CSS i JS inline) interaktywny wizualizator algorytmów sortowania. Wymagania: wybór algorytmu (bąbelkowe, przez wstawianie, szybkie, przez scalanie), przyciski „Losuj” i „Start”, animowane słupki, regulacja prędkości i rozmiaru tablicy suwakami, licznik porównań i zamian. Wykres musi mieć czytelną oś Y ze skalą wartości i podpisem „wartość”, oś X z podpisem „indeks elementu w tablicy”, oraz krótkie zdanie nad wykresem wyjaśniające, że każdy słupek to jeden element tablicy, a jego wysokość odpowiada wartości. Umieść widoczną legendę kolorów bezpośrednio nad wykresem (element porównywany, zamieniany, już posortowany). Estetyczny, ciemny motyw, gotowy do uruchomienia.

9 czerwca 2026 roku Anthropic pokazał model, który wyłamuje się z dotychczasowego schematu. Zwykle nowa wersja jest „następcą” poprzedniej - Fable 5 został pozycjonowany o całą klasę wyżej niż Opus, w nowej rodzinie o nazwie Mythos. Na chwilę zniknął z dystrybucji (kontrole eksportu ze strony administracji USA), ale od 1 lipca 2026 jest znów dostępny - także na kontach abonamentowych. W tym artykule pokażemy, co ten model wnosi, jak wypada na benchmarkach i czym różni się od Opus 4.8. Wszystkie zrzuty pochodzą z naszego konta na claude.ai, z modelem ustawionym kolejno na Fable 5 i - dla porównania - Opus 4.8.

Czym jest Fable 5 i skąd rodzina Mythos

Do tej pory najmocniejsze modele Anthropic należały do klasy Opus. Fable 5 otwiera nową, wyższą klasę o nazwie Mythos. Ważne, żeby nie pomylić dwóch nazw, bo chodzi o ten sam „mózg” w dwóch wydaniach:

  • Fable 5 to publicznie dostępny wariant z pełnymi zabezpieczeniami - z niego korzystamy w claude.ai i przez API.
  • Mythos 5 to dokładnie ten sam model (te same wagi, czyli ta sama wyuczona „wiedza”), ale bez zabezpieczeń. Anthropic udostępnia go wyłącznie zaufanym partnerom w programie Project Glasswing - docelowo między innymi organizacjom cyberbezpieczeństwa i badaczom biomedycznym.

Zanim przejdziemy dalej, dwa pojęcia po polsku, bo będą wracać. Token to najmniejsza porcja tekstu, jaką przetwarza model - z grubsza kawałek słowa. Okno kontekstu to ilość tekstu, jaką model widzi naraz (im większe, tym więcej dokumentów, kodu czy historii rozmowy zmieści się w jednym zadaniu).

Na naszym koncie Fable 5 pojawia się w liście wyboru modeli, opisany jako „do Twoich najtrudniejszych wyzwań” - nad Opus 4.8 „do złożonych zadań”:

Lista wyboru modeli na koncie claude.ai: Fable 5 z etykietą dostępności do 7 lipca i opisem do najtrudniejszych wyzwań, poniżej Opus 4.8 do złożonych zadań, Sonnet 5 i Haiku 4.5
Lista wyboru modeli na naszym koncie: Fable 5 stoi ponad Opus 4.8, z opisem „do najtrudniejszych wyzwań”. Poniżej Opus 4.8, Sonnet 5 i Haiku 4.5.

Co wnosi - możliwości modelu

Od strony parametrów Fable 5 obsługuje okno kontekstu do 1 miliona tokenów i potrafi wygenerować w jednej odpowiedzi do 128 tysięcy tokenów. Przyjmuje tekst i obrazy (jest multimodalny). Ale najważniejsza zmiana nie kryje się w liczbach, tylko w tym, jak długo model potrafi pracować nad jednym zadaniem.

Chodzi o zadania agentowe o długim horyzoncie. To takie, w których model wykonuje wiele kroków po kolei, przez dłuższy czas, pilnując celu i wracając do wcześniejszych ustaleń. Anthropic podaje, że Fable „utrzymuje uwagę przez miliony tokenów” - potrafi prowadzić jedno długie, wieloetapowe zadanie bez gubienia wcześniejszych ustaleń, od pierwszego kroku aż po gotowy wynik.

Kilka innych obszarów, w których model pokazuje pazur:

  • Pamięć w plikach. Slay the Spire to strategiczna gra karciana, w której o wyniku decyduje planowanie przez setki kolejnych ruchów - dlatego służy do sprawdzania, jak model radzi sobie w długich zadaniach. Gdy Fable mógł zapisywać sobie notatki do plików i później do nich wracać - czyli miał własny „notatnik” poza oknem kontekstu, zamiast trzymać wszystko w pamięci naraz - grał trzy razy lepiej niż Opus 4.8. To praktyczny dowód, że model dobrze wykorzystuje pamięć zewnętrzną tam, gdzie sama pamięć modelu już nie wystarcza.
  • Praca naukowa. Przy projektowaniu leków eksperci Anthropic, pracując z modelem, przyspieszyli pracę około dziesięciokrotnie. W projektowaniu białek model dorównał wykwalifikowanym specjalistom lub ich przewyższył w 9 z 14 zadań. Z kolei w biologii molekularnej naukowcy w mniej więcej 80% przypadków woleli hipotezy postawione przez Fable od tych z modeli klasy Opus.
  • Wzrok. Fable potrafi grać w Pokémon FireRed, opierając się wyłącznie na obrazie z gry (bez podpowiedzi tekstowych), i osiąga czołowe wyniki w zadaniach wizualnych.
  • Regulowany wysiłek rozumowania. Poziom „reasoning effort” (ile model „myśli” przed odpowiedzią) można podkręcać - im wyżej, tym więcej pracy model wkłada w jedną odpowiedź i tym więcej tokenów zużywa.

Tak wygląda praca z Fable 5 w oknie rozmowy: po lewej polecenie i odpowiedź modelu, po prawej gotowy, wyrenderowany wynik (tutaj grafika, którą model przygotował na podstawie opisu):

Okno rozmowy claude.ai z modelem Fable 5 w układzie dzielonym: po lewej polecenie po polsku i odpowiedź modelu, po prawej panel z wyrenderowaną grafiką SVG - rudym kotem na czerwonym rowerze - przygotowaną przez model
Fable 5 w akcji na naszym koncie: po lewej polecenie i odpowiedź, po prawej panel z gotowym, wyrenderowanym wynikiem - kotem na rowerze.

Jak wypada na benchmarkach

Anthropic pokazuje Fable 5 jako model osiągający czołowe wyniki na większości testów. Dwie liczby, w których widać różnicę wobec Opus 4.8 najwyraźniej, dotyczą kodowania:

Fable 5 kontra Opus 4.8 - wybrane benchmarki
JSystems, dane: Anthropic
SWE-bench Pro - agentowe, wieloetapowe kodowanie
Fable 5
80,3%
Opus 4.8
69,2%
FrontierCode Diamond - najtrudniejszy kod
Fable 5
29,3%
Opus 4.8
13,4%
Skala 0-100%. Na FrontierCode Diamond oba modele mają niskie wyniki bezwzględne (to celowo bardzo trudny test), ale Fable jest tu ponad dwukrotnie skuteczniejszy.

Poza kodowaniem Anthropic raportuje, że na teście FrontierCode (od twórców Cognition) Fable ma najwyższy wynik wśród czołowych modeli nawet przy średnim poziomie wysiłku, w analityce jako pierwszy przekroczył 90% (skok o 10 punktów nad Opus), a w zadaniach finansowych osiągnął najwyższy wynik w rozumowaniu na poziomie seniora. Reguła, która się z tego wyłania, jest prosta: im dłuższe i bardziej złożone zadanie, tym większa przewaga Fable. Na krótkich, prostych poleceniach różnica potrafi być niewielka - co za chwilę zobaczymy na żywym przykładzie.

Czym różni się od Opus 4.8

Fable to nie „nowy Opus”, tylko wyższa półka za wyższą cenę. Najkrócej różnice wyglądają tak:

CechaFable 5Opus 4.8
Pozycjarodzina Mythos - o klasę wyżejdotychczasowa klasa premium
Cena wejścia / wyjścia10 / 50 USD za mln tokenów5 / 25 USD za mln tokenów
Cache (odczyt / zapis)1,00 / 12,50 USD za mln0,50 / 6,25 USD za mln
Okno kontekstu1 mln tokenów1 mln tokenów
Modalnościtekst + obrazytekst + obrazy
Wysiłek rozumowaniaregulowanyregulowany
Bezpieczeństwoklasyfikator kieruje wrażliwe tematy do Opus 4.8; retencja 30 dnidostępna zerowa retencja danych
Najlepszy donajdłuższych, najbardziej złożonych zadań agentowych i naukowychcodziennych złożonych zadań, gdzie liczy się koszt i prywatność

Cena jest kluczowa: Fable kosztuje mniej więcej dwa razy więcej. Opus 4.8 zostaje więc bardzo sensownym wyborem tam, gdzie liczą się koszty albo zerowa retencja danych - zresztą sam Fable używa Opusa jako „hamulca bezpieczeństwa” (o tym w następnej sekcji).

Żeby pokazać różnicę na żywo, daliśmy obu modelom dokładnie to samo polecenie przy tym samym, wysokim poziomie wysiłku: „narysuj kota jadącego na rowerze jako grafikę SVG”. To proste, żartobliwe zadanie rysowania kodem - najważniejsze, że oba modele dostały identyczne polecenie. Oto wyniki obok siebie:

Grafika SVG wygenerowana przez Fable 5: rudy pręgowany kot pochylony do przodu na czerwonym rowerze, z ogonem uniesionym do góry, wąsami i spiczastymi uszami, obok linie ruchu, jasne tło bez scenerii
Fable 5 - rudy kot w dynamicznej pozie, pochylony do przodu, z ogonem w górze i liniami ruchu.
Grafika SVG wygenerowana przez Opus 4.8: rudy pręgowany kot skierowany przodem, siedzący na czerwonym rowerze, w tle słońce, chmurki i zielona łąka
Opus 4.8 - kot en face, z pełniejszą scenką: słońce, chmurki i łąka.

Obie wersje wyszły dobrze - każdy model podszedł do tematu inaczej: Fable postawił na dynamiczną, pochyloną pozę z liniami ruchu, Opus dorzucił pełniejsze tło ze słońcem i łąką. Na tak krótkim zadaniu różnica jest w zasadzie kosmetyczna - i dobrze to ilustruje wcześniejszy wniosek: prawdziwy dystans między tymi modelami widać dopiero na długich, wieloetapowych zadaniach, a nie na jednym poleceniu.

Jak Fable pilnuje bezpieczeństwa

Skoro Mythos to mocniejsza klasa, Anthropic obudował publiczny wariant dodatkowym mechanizmem. W Fable 5 działa klasyfikator (mały model pomocniczy oceniający treść zapytania), który wrażliwe zapytania - z trzech wąskich obszarów wysokiego ryzyka, wymienionych niżej - kieruje do bezpieczniejszego Opus 4.8. Wygląda to tak:

1
Zapytanie trafia do Fable 5

Każde Twoje polecenie przechodzi najpierw przez wbudowany klasyfikator bezpieczeństwa.

2
Klasyfikator sprawdza trzy obszary ryzyka

Za wrażliwe uznaje trzy tematy: cyberbezpieczeństwo ofensywne (pomoc w atakach), biologię i chemię wysokiego ryzyka oraz próby skopiowania samego modelu (tzw. distillation - „wyciągnięcie” jego zdolności, żeby wytrenować własny). Zwykłe pytania - programowanie, analiza danych, pisanie - wrażliwe nie są.

3
Rozgałęzienie odpowiedzi

Jeśli klasyfikator wykryje temat z tych trzech obszarów, odpowiedź przejmuje Opus 4.8. Jeśli nie - a to ponad 95% sesji - odpowiada Fable 5.

Mechanizm uruchamia się rzadko: średnio w mniej niż 5% sesji. Wszystkie zapytania i odpowiedzi klasy Mythos Anthropic przechowuje u siebie przez 30 dni (to tzw. retencja danych - czas, po którym są kasowane) i nie używa ich do trenowania modeli. Odporność na obejścia zabezpieczeń wygląda solidnie - w ponad tysiącu godzin płatnego programu wyszukiwania błędów nie znaleziono uniwersalnego „jailbreaka”, a wobec 30 publicznych technik obchodzenia zabezpieczeń model nie wygenerował ani jednej szkodliwej odpowiedzi w pojedynczej turze. To także powód, dla którego Opus 4.8 - którego można używać z zerową retencją, czyli w ogóle bez zapisywania danych - bywa lepszym wyborem dla danych wrażliwych.

Realne przykłady działania

Cały ten artykuł zbudowaliśmy na dwóch zadaniach uruchomionych na naszym koncie - oto one w pigułce:

  • Aplikacja w jednym pliku (kod). Jedno polecenie po polsku - „zbuduj interaktywny wizualizator algorytmów sortowania z ciemnym motywem, czterema algorytmami, suwakami i licznikami” - i Fable 5 zwrócił kompletny, uruchamialny plik HTML, który widzisz na grafice otwierającej ten artykuł. Estetyczny i działający za pierwszym razem, bez poprawek.
  • Grafika na porównanie (SVG). To samo polecenie o kocie na rowerze na Fable 5 i na Opus 4.8. Oba modele poradziły sobie dobrze, a różnica okazała się drobna - co jest równie ważnym wnioskiem jak same benchmarki.

Z tego wychodzi praktyczna wskazówka, kiedy w ogóle sięgać po droższy model. Fable 5 zwróci swoją wyższą cenę tam, gdzie zadanie jest naprawdę długie i złożone: duży refaktor, wieloetapowa praca agentowa, trudna analiza czy badania naukowe. Do codziennych zadań, gdzie różnica jakości i tak nie przeważy dwukrotnego kosztu, Opus 4.8 albo Sonnet najczęściej w zupełności wystarczą. Warto też pamiętać, że model to jedno, a umiejętność pracy z nim to drugie - dopiero dobrze poprowadzony agent (jasny cel, kontekst, ograniczenia) pokazuje, na co go stać.

Jeśli chcesz zobaczyć na żywo, jak pracować z takimi modelami Anthropic w praktyce - od pojedynczego polecenia po zespoły agentów w narzędziu Claude Code - mamy na to konkretne szkolenie. Szczegóły o samym modelu znajdziesz też na oficjalnej stronie Anthropic.

Szkolenie Claude Code JSystems - od zera do zespołu agentów AI

Szkolenie Claude Code - od zera do zespołu agentów AI

Praca z modelami Anthropic (w tym Fable) w praktyce: polecenia, kontekst, tryby uprawnień, MCP, hooki i systemy multi-agent - na żywym kodzie podczas trzydniowego szkolenia. Prowadzi Łukasz Matuszewski. Szkolenie ma termin gwarantowany - odbędzie się niezależnie od liczby zgłoszeń.

Szkolenie Claude Code -->

Najczęściej zadawane pytania

Czym Fable 5 różni się od Opus 4.8?
Fable 5 należy do nowej rodziny Mythos, którą Anthropic pozycjonuje o klasę wyżej niż Opus. Kosztuje mniej więcej dwa razy więcej (10 i 50 dolarów za milion tokenów wejścia i wyjścia wobec 5 i 25 dolarów u Opus 4.8) i ma wbudowany klasyfikator, który wrażliwe zapytania przekierowuje do odpowiedzi Opus 4.8. Największą przewagę Fable pokazuje na długich, wieloetapowych zadaniach; na krótkich i prostych różnica bywa kosmetyczna.
Czy Fable 5 jest lepszy od Opusa do wszystkiego?
Nie. Przewaga Fable rośnie razem z długością i złożonością zadania - na krótkim poleceniu, jak wygenerowanie jednej grafiki, oba modele dają porównywalny wynik. Opus 4.8 jest tańszy i oferuje zerową retencję danych, więc do codziennych zadań oraz tam, gdzie liczy się koszt lub prywatność, często jest lepszym wyborem.
Ile kosztuje Claude Fable 5?
Fable 5 kosztuje 10 dolarów za milion tokenów wejścia i 50 dolarów za milion tokenów wyjścia, czyli około dwa razy więcej niż Opus 4.8. Pamięć podręczna promptu (cache) to 1 dolar za milion tokenów odczytu i 12,5 dolara za milion tokenów zapisu. Za długi kontekst nie ma dopłaty.
Co to jest rodzina Mythos i model Mythos 5?
Mythos to nowa klasa modeli Anthropic, o poziom wyżej niż klasa Opus. Fable 5 to jej publicznie dostępny wariant z pełnymi zabezpieczeniami. Mythos 5 to ten sam model bez zabezpieczeń, udostępniany wyłącznie zaufanym partnerom w ramach programu Project Glasswing - na przykład organizacjom cyberbezpieczeństwa i badaczom biomedycznym.

Komentarze (0)

Musisz być zalogowany by móc dodać komentarz. Zaloguj się przez Google

Brak komentarzy...