OprogramowanieSztuczna InteligencjaWiedza

Claude Opus 4.8 – co nowego i czy warto korzystać z nowej wersji?

Claude Opus 4.8 – co nowego i czy warto korzystać z nowej wersji?

Anthropic wydał Opus 4.8 bez zmiany cen. Nowa wersja bazuje na Opus 4.7 z poprawkami w benchmarkach, lepszym zachowaniem w zadaniach agentycznych i — co warte podkreślenia — znacznie niższymi kosztami trybu fast. Jeśli korzystasz z Claude Code lub API, kilka zmian dotyczy cię bezpośrednio.

Premiera odbyła się 28 maja 2026. Model jest dostępny natychmiast zarówno przez claude.ai, jak i przez API (model string: claude-opus-4-8). Razem z nim Anthropic uruchomił trzy nowe funkcje: dynamic workflows, kontrolkę effort dla użytkowników i zmianę w Messages API, która ułatwia zarządzanie instrukcjami w trakcie działania agenta.

Czym różni się Opus 4.8 od Opus 4.7?

Opus 4.8 to nie rewizja od podstaw — to celowa poprawa w kilku konkretnych obszarach, przy zachowaniu tej samej architektury i cennika. Anthropic opisuje go jako „skromną, ale odczuwalną” aktualizację. Brzmi jak dyplomacja korporacyjna… ale tym razem liczby to potwierdzają.

Największa zmiana dotyczy uczciwości modelu w zadaniach kodowania. Opus 4.8 jest ok. 4 razy rzadziej skłonny do przemilczania błędów w napisanym przez siebie kodzie. Poprzednie wersje potrafiły „skończyć” zadanie, mimo że testy nie przechodziły — i nie informowały o tym użytkownika. To był realny problem przy długich, autonomicznych sesjach. Teraz model częściej sygnalizuje niepewność i flaguje wątpliwości zamiast udawać, że wszystko gra.

W ocenie zespołu ds. bezpieczeństwa Anthropic, Opus 4.8 osiąga nowe maksima w zakresie „prosocjalnych cech” — czyli wspierania autonomii użytkownika i działania w jego interesie. Wskaźniki niepożądanych zachowań (np. skłonność do manipulacji czy współpracy z nadużyciami) są wyraźnie niższe niż u Opus 4.7. Nie jest to reklama — to zawartość opublikowanego System Cardu.

Porównanie Opus 4.8 vs Opus 4.7 — kluczowe różnice

Porównanie Claude Opus 4.8 i Opus 4.7 według dostępnych danych
Obszar Opus 4.7 Opus 4.8
Przemilczanie błędów w kodzie Częstsze (~4x) Rzadsze — flaguje niepewności
Cena trybu fast (input/output) Wyższa 3x taniej niż poprzednie modele
Prędkość trybu fast Brak danych 2,5x szybciej niż tryb standardowy
OSWorld-Verified (agentyka) 82,3% (zaktualizowany wynik) Wyższy — szczegóły w System Card
Cena standardowa (input/output) $5 / $25 za mln tokenów Bez zmian: $5 / $25
Wskaźniki misalignment Wyższe niż Opus 4.8 Podobne do Claude Mythos Preview

Tryb fast: 2,5x szybciej i 3x taniej – co to znaczy w praktyce?

Fast mode istniał już wcześniej, ale dla wielu projektów jego cena była po prostu zaporowa. Teraz Anthropic obniżył koszt fast mode dla Opus 4.8 trzykrotnie względem poprzednich modeli. Przy cenie standardowej $5/$25 za milion tokenów, fast mode dla Opus 4.8 wynosi $10/$50 — to więcej, ale proporcja do zysku prędkości jest lepsza niż kiedykolwiek.

Czy to oznacza, że warto zawsze używać fast mode? Niekoniecznie. Dla zadań analitycznych i długich kontekstów tryb standardowy nadal daje lepszą jakość rozumowania. Fast mode sprawdza się przy krótkich, powtarzalnych zadaniach: klasyfikacja, ekstrakcja danych, generowanie powtarzalnych fragmentów kodu. Przy asynchronicznych workflow agentycznych — tam różnica prędkości robi już realną różnicę.

Dynamic workflows: setki subagentów w jednej sesji

To prawdopodobnie najbardziej technicznie imponująca nowość w tym wydaniu. Dynamic workflows (dostępne w research preview) pozwala Claude Code na planowanie pracy, uruchamianie setek równoległych subagentów i weryfikację wyników przed raportem do użytkownika — wszystko w ramach jednej sesji.

Konkretny przypadek użycia podany przez Anthropic: migracja na poziomie całego repozytorium przez setki tysięcy linii kodu, od startu do merge, z istniejącymi testami jako kryterium jakości. Do tej pory wymagało to ręcznej koordynacji lub własnej infrastruktury. Tu robi się ciekawie — bo Opus 4.8 może działać dłużej niż poprzednie modele w ramach tych subagentów, co przekłada się na głębsze analizy bez przerywania sesji.

Ale nie każdy z tego skorzysta. Dynamic workflows jest dostępny wyłącznie w planach Enterprise, Team i Max w Claude Code. Użytkownicy darmowi i Pro — przynajmniej na razie — nie mają do tej funkcji dostępu.

Kontrolka effort: sam decydujesz, ile Claude myśli

28 maja 2026 do claude.ai trafiła też kontrolka effort — widoczna obok selektora modelu. Działa prosto: wyższy effort = więcej myślenia, lepsze odpowiedzi, wolniej i drożej. Niższy effort = szybciej, taniej, odpowiedzi na prostsze pytania.

Anthropic opisuje to jako wybór, który „teraz należy do użytkownika”. W praktyce to coś, czego brakowało — szczególnie przy pytaniach, gdzie pełna moc modelu jest jak użycie koparki do kopania dziury po kwiatku. Dostępne poziomy to: standardowy, extra i max. Domyślnie Opus 4.8 startuje na „high” (wysoki), który według Anthropic daje najlepszą równowagę między jakością a doświadczeniem użytkownika.

Limit zapytań w Claude Code został zwiększony, żeby uwzględnić wyższe zużycie tokenów przy wyższych poziomach effort. Dobra wiadomość dla tych, którzy uderzali w ściany przy intensywnych sesjach.

Messages API: aktualizacja instrukcji bez resetowania cache

Zmiana techniczna, ale dla deweloperów budujących własne harnessy agentyczne — spora ulga. Messages API przyjmuje teraz wpisy systemowe wewnątrz tablicy messages, nie tylko na początku sesji. Oznacza to, że możesz aktualizować instrukcje Claude’a w trakcie działania agenta (np. zmieniać uprawnienia, budżet tokenów, kontekst środowiska) bez przerywania cache promptu ani obchodzenia przez user turn.

Wcześniej wymuszało to albo przebudowę całego kontekstu, albo nieeleganckie wstrzykiwanie instrukcji przez wiadomości użytkownika — co zaburzało logikę konwersacji. Teraz jest to po prostu natywnie obsługiwane.

Co z Claude Mythos? Kiedy trafi do wszystkich?

Anthropic wskazuje wyraźnie: Mythos to wyższy poziom inteligencji niż Opus. Aktualnie (maj 2026) dostęp do Claude Mythos Preview mają tylko wybrane organizacje — i tylko do zadań w obszarze cyberbezpieczeństwa, w ramach projektu Glasswing. Modele tej klasy wymagają silniejszych zabezpieczeń przed szerokim udostępnieniem.

Anthropic twierdzi, że „szybko robi postępy” w rozwijaniu tych zabezpieczeń i planuje udostępnić modele klasy Mythos wszystkim klientom „w najbliższych tygodniach”. Nie ma konkretnej daty. Jednak fakt, że przy wydaniu Opus 4.8 komunikują Mythos tak wyraźnie, sugeruje, że premiera może być rzeczywiście bliska.

Najczęściej zadawane pytania

Czy Claude Opus 4.8 jest droższy od Opus 4.7?

Nie — cennik pozostaje bez zmian. Standardowe użycie kosztuje $5 za milion tokenów wejściowych i $25 za milion wyjściowych. Fast mode (tryb przyspieszony) kosztuje $10/$50, ale jest trzykrotnie tańszy niż fast mode w poprzednich modelach Anthropic — i działa 2,5x szybciej niż tryb standardowy.

Jak włączyć Opus 4.8 przez API?

Model string to claude-opus-4-8. Wystarczy zmienić parametr modelu w wywołaniu API — żadnych dodatkowych konfiguracji nie trzeba. Dokumentacja Anthropic opisuje wszystkie nowe parametry, w tym effort i wpisy systemowe wewnątrz messages.

Co to są dynamic workflows i kto ma do nich dostęp?

Dynamic workflows to funkcja Claude Code pozwalająca uruchamiać setki równoległych subagentów w jednej sesji — z weryfikacją wyników przed finalnym raportem. Dostępna w research preview dla planów Enterprise, Team i Max. Użytkownicy Pro i darmowi nie mają dostępu na dzień premiery.

Czym różni się kontrolka effort od zwykłego wyboru modelu?

Wybór modelu (Opus vs Sonnet vs Haiku) decyduje o architekturze i maksymalnych możliwościach. Kontrolka effort to regulacja w ramach jednego modelu: ile tokenów „myślenia” Claude zużywa na daną odpowiedź. Niższy effort = szybciej i taniej; wyższy effort = głębsza analiza, ale więcej czasu i kosztów. Domyślnie Opus 4.8 startuje na poziomie „high”.

Dlaczego Anthropic zaktualizował wynik OSWorld-Verified dla Opus 4.7?

Anthropic zmienił metodologię uruchamiania ewaluacji OSWorld-Verified, żeby dokładniej odzwierciedlić realne zachowanie modelu. Zaktualizowany wynik Opus 4.7 to 82,3%. Szczegóły metodologiczne są opisane w System Card Opus 4.8.

Kiedy Claude Mythos będzie dostępny dla wszystkich?

Anthropic nie podał konkretnej daty. Według komunikatu z 28 maja 2026 firma „spodziewa się” udostępnienia modeli klasy Mythos wszystkim klientom „w nadchodzących tygodniach”. Aktualnie dostęp mają tylko wybrane organizacje — wyłącznie do zastosowań w cyberbezpieczeństwie, w ramach Projektu Glasswing.

Co zmieniło się w Messages API?

API przyjmuje teraz wpisy systemowe bezpośrednio wewnątrz tablicy messages, nie tylko na początku sesji. Dzięki temu deweloperzy mogą aktualizować instrukcje modelu w trakcie sesji agentycznej (np. zmieniać uprawnienia lub budżet tokenów) bez zerowania cache ani obchodzenia przez user turn.

Czy Opus 4.8 jest bezpieczniejszy od poprzedniej wersji?

Według oceny wewnętrznego zespołu ds. bezpieczeństwa Anthropic — tak. Wskaźniki niepożądanych zachowań (m.in. skłonność do deceptive reasoning i współpracy z nadużyciami) są niższe niż u Opus 4.7 i zbliżone do Claude Mythos Preview, który był dotychczas najlepiej wyalignowanym modelem firmy.

Co wdrożyć od razu — i co możesz poczekać

Jeśli budujesz coś na API: zaktualizuj model string na claude-opus-4-8 i sprawdź, czy zmiana w Messages API odblokuje ci architekturę, której unikałeś przez problemy z cache. To dosłownie jedna linijka konfiguracji.

Jeśli używasz Claude Code intensywnie — warto przetestować dynamic workflows nawet w wersji research preview. Migracje na poziomie całego repozytorium to coś, za co wcześniej płaciło się albo czasem, albo zewnętrznymi narzędziami. Opcja „setki subagentów, jedna sesja, weryfikacja końcowa” zmienia ten rachunek.

Kontrolka effort? Ustaw ją świadomie. Domyślne „high” to dobry punkt startowy, ale przy prostych, powtarzalnych zadaniach przełączenie na niższy poziom realnie obniży koszty bez utraty jakości. Można to ująć prosto: nie używaj młota do wbijania pinezek. Opus 4.8 pozwala teraz dobierać wielkość narzędzia do zadania.

Źródła i dalsze informacje

  1. Anthropic. „Introducing Claude Opus 4.8.” anthropic.com/news/claude-opus-4-8
  2. Anthropic. „Claude Opus 4.8 System Card.” Pełna dokumentacja bezpieczeństwa i benchmarków dostępna na stronie Anthropic.
  3. Anthropic. „Dynamic Workflows in Claude Code.” docs.claude.com