GLM-5.2: chiński model open-source, który depcze po piętach Opusowi 4.8

GLM-5.2 to nowy model od chińskiej firmy Z.ai, który w kodowaniu długodystansowym ustępuje Claude Opus 4.8 dosłownie o włos: 74,4% do 75,1% na benchmarku FrontierSWE. Sęk tkwi w cenie. Za milion tokenów zapłacisz tu mniej więcej sześciokrotnie mniej niż za GPT-5.5, a wagi modelu pobierzesz za darmo z licencją MIT.

Premiera wypadła 13 czerwca 2026. To trzecia odsłona serii GLM-5 w niecałe cztery miesiące, co samo w sobie mówi sporo o tempie, jakie narzuciła firma znana wcześniej jako Zhipu AI.

Czym właściwie jest GLM-5.2 i skąd się wziął

GLM-5.2 to model typu Mixture-of-Experts z liczbą parametrów w okolicy 744-753 miliardów, z czego na pojedynczy token aktywuje się około 40 miliardów. Architektura bazuje na 384 ekspertach i odziedziczyła rdzeń po GLM-5 oraz GLM-5.1.

Tu pojawia się detal, który łatwo przeoczyć, a który ma ciężar polityczny. Cała seria GLM-5 powstała na chipach Huawei Ascend 910B, w środowisku MindSpore, na 28,5 bilionach tokenów treningowych. Bez NVIDIA. Dla zespołów spoza Stanów to nie ciekawostka, lecz argument o niezależności od łańcucha dostaw.

Co zmieniło się względem GLM-5.1

Skok dotyczy przede wszystkim kontekstu: z 200 tysięcy tokenów w GLM-5.1 do pełnego miliona. Z.ai dorzuciła też dwa tryby wysiłku rozumowania, High i Max, w miejsce pojedynczego ustawienia ze starszej wersji. Producent radzi sięgać po Max przy wieloetapowych zadaniach programistycznych; High zostawia na lżejszą robotę, gdzie liczy się czas odpowiedzi.

GLM-5.2 kontra Opus 4.8: kto wygrywa w kodowaniu?

Opus 4.8 wciąż prowadzi, ale przewaga skurczyła się do statystycznego szumu. Na benchmarku FrontierSWE, który mierzy zdolność doprowadzenia długiego zadania do końca, GLM-5.2 notuje 74,4%, a Opus 4.8 osiąga 75,1%. Na SWE-bench Pro chiński model wskakuje na 62,1 i wyprzedza GPT-5.5 z wynikiem 58,6.

Jest jeden obszar, w którym GLM-5.2 wyprzedził wszystkie warianty Opusa: front-end. To akurat boli, bo właśnie tam Anthropic długo był nie do ruszenia. GLM-5.2 jako pierwszy otwarty model przekroczył próg 80% na Terminal-Bench 2.1, lądując na 81,0. W rankingu Artificial Analysis Intelligence Index zgarnął 51 punktów: najwyższy wynik wśród modeli o otwartych wagach.

Warto jednak studzić zachwyt. Wyniki ogłosiła w dużej mierze sama Z.ai, a niezależne ewaluacje pojawiły się dopiero po starcie. Różnica jednego punktu na benchmarku rzadko przekłada się na to, co poczujesz w codziennej pracy z agentem. Polscy praktycy już zresztą puszczają oba modele w bezpośrednie starcia, choćby przy budowie prostych aplikacji do wizualizacji wnętrz, i dzielą się nagraniami z takich pojedynków.

Porównanie GLM-5.2, Claude Opus 4.8 i GPT-5.5 w zadaniach kodowania
Cecha	GLM-5.2	Claude Opus 4.8	GPT-5.5
FrontierSWE	74,4%	75,1%	72,6%
SWE-bench Pro	62,1	brak danych	58,6
Terminal-Bench 2.1	81,0	brak danych	brak danych
Licencja	MIT (otwarte wagi)	zamknięta	zamknięta
Cena za 1 mln tokenów wyjściowych	4,40 USD	brak w zestawieniu	30 USD

Milion tokenów kontekstu, czyli co IndexShare zmienia w praktyce

Duże okno kontekstu zwykle ma haczyk: im dłuższy kontekst, tym wolniej i drożej. GLM-5.2 próbuje ten haczyk wyszarpać. Odpowiada za to IndexShare, czyli usprawnienie znane z mechanizmu DeepSeek Sparse Attention.

Sztuczka polega na tym, że ten sam indekser obsługuje co cztery warstwy rzadkiej uwagi, zamiast działać osobno w każdej. Efekt? Przy kontekście miliona tokenów liczba operacji na token spada 2,9-krotnie. Do tego doszła ulepszona warstwa Multi-Token Prediction do dekodowania spekulatywnego, która wydłuża akceptowaną sekwencję tokenów nawet o 20%.

Co to daje przy klawiaturze? Model utrzymuje w głowie cały projekt: setki plików, długą sesję agentową, dokumentację liczoną w setkach stron. Ale milion tokenów to teoretyczny sufit, nie obietnica, że jakość rozumowania pozostanie stała na całej długości. Tu akurat żaden producent nie składa wiążących deklaracji, i słusznie.

Ile to kosztuje i dla kogo ma to sens

Pieniądze to powód, dla którego o GLM-5.2 w ogóle warto rozmawiać. Dostęp przez API wyceniono na 1,40 dolara za milion tokenów wejściowych i 4,40 dolara za milion wyjściowych, łącznie 5,80 dolara. GPT-5.5 liczy sobie 5 dolarów za wejście i 30 za wyjście, razem 35 dolarów za milion. To mniej więcej jedna szósta ceny przy porównywalnych wynikach w kodowaniu.

Dla długich kontekstów Z.ai dorzuciła stawkę za wejście z cache: około 0,26 dolara za milion tokenów. Jeśli wolisz abonament, masz plany GLM Coding w wariantach Lite, Pro, Max i Team. Ceny bywają promocyjne i różnią się zależnie od regionu; publiczne cenniki z czerwca 2026 pokazują Lite w okolicach 3-13 dolarów miesięcznie, Pro mniej więcej 15-50 dolarów, a Max od 80 do 112 dolarów.

Komu to się opłaca? Jeśli kodujesz cały dzień w agencie, abonament niemal zawsze wygra z płaceniem za token. Przy nieregularnym, niskim użyciu sensowniejsze bywa API z płatnością za zużycie. Otwarte wagi otwierają trzecią drogę: hosting na własnej infrastrukturze, gdzie płacisz wyłącznie za moc obliczeniową i prąd. Dla firm pilnujących danych to czasem przesądza sprawę.

Dlaczego ten model pojawił się akurat teraz

Timing nie jest przypadkiem. Premiera wypadła w środku zamieszania wokół dostępu do modeli amerykańskich. Dyrektywa eksportowa administracji Trumpa zablokowała zagranicznym użytkownikom korzystanie z Claude Fable 5, a zawieszenie weszło w życie niemal z dnia na dzień.

W kilka godzin po tej blokadzie GLM-5.2 zaczął wskakiwać na szczyty rankingów rozumowania jako otwarta alternatywa. Dla zespołu spoza Stanów, który nagle stracił dostęp do swojego głównego modelu, otwarte wagi na licencji MIT są kołem ratunkowym, nie ideologicznym wyborem. Możesz pobrać model, odpalić go lokalnie i nikt ci tego nie odbierze administracyjną decyzją.

GLM-5.2 wpina się od pierwszego dnia w popularne narzędzia: Claude Code, Cline, OpenCode, Roo Code, Goose, Crush, OpenClaw i Kilo Code, przez endpoint zgodny z OpenAI. W konfiguracji dla Claude Code sloty Opus i Sonnet wskazują na ten sam endpoint GLM-5.2, a slot Haiku schodzi do lżejszego GLM-4.5-air. Migracja sprowadza się więc do zmiany jednej zmiennej środowiskowej.

Najczęściej zadawane pytania

Czy GLM-5.2 jest naprawdę darmowy?

Same wagi modelu tak: pobierzesz je z Hugging Face na licencji MIT i odpalisz lokalnie bez opłat licencyjnych. Płacisz wtedy tylko za sprzęt i prąd. Dostęp przez API albo abonament GLM Coding kosztuje już osobno.

Jak GLM-5.2 wypada przy Claude Opus 4.8?

Bardzo blisko. Na FrontierSWE traci jeden punkt procentowy (74,4% do 75,1%), za to w kodowaniu front-end przewyższa wszystkie warianty Opusa. Różnica w portfelu jest znacznie większa niż różnica w jakości.

Ile tokenów mieści okno kontekstu?

Milion tokenów wejściowych (dokładnie 1 048 576), z odpowiedzią ograniczoną zwykle do 131 072 tokenów. To pięciokrotny skok względem 200 tysięcy w GLM-5.1.

Czym różnią się tryby High i Max?

High stawia na równowagę między szybkością a jakością. Max wyciska maksimum logicznego rozumowania kosztem czasu. Z.ai zaleca Max do wieloetapowych zadań programistycznych.

Na czym polega IndexShare?

To technika dzielenia indeksera między co czwartą warstwą rzadkiej uwagi. Dzięki niej liczba operacji na token spada 2,9-krotnie przy kontekście miliona tokenów, co tnie koszt długich sesji.

Czy mogę użyć GLM-5.2 w Claude Code?

Tak, od dnia premiery. Wystarczy przekierować konfigurację na endpoint GLM-5.2 zgodny z OpenAI. Sloty Opus i Sonnet zmapujesz na ten sam model, a Haiku zejdzie do GLM-4.5-air.

Dlaczego trening na chipach Huawei ma znaczenie?

Bo uniezależnia model od sprzętu NVIDIA i amerykańskich ograniczeń eksportowych. Dla firm w regionach objętych restrykcjami to czasem jedyna droga do modelu klasy frontier.

Czy benchmarkom Z.ai można ufać?

Z rezerwą. Część wyników ogłosił sam producent, a niezależne testy ruszyły dopiero po starcie. Wczesne ewaluacje zewnętrzne potwierdzały jednak grubsze tezy o pozycji tuż za Opusem 4.8.

Co z tego wynika, jeśli kodujesz na co dzień

GLM-5.2 nie detronizuje Opusa 4.8 na benchmarkach, lecz zmienia rachunek ekonomiczny. Skoro tracisz ułamek jakości, a zyskujesz sześciokrotnie niższy koszt plus otwarte wagi, pytanie przestaje brzmieć „który model jest najlepszy”, a zaczyna „ile naprawdę jestem gotów dopłacić za ten ostatni punkt procentowy”. Przetestuj go na własnym repozytorium, zanim uwierzysz komukolwiek na słowo: twoja baza kodu powie ci więcej niż dziesięć rankingów.

Źródła i dalsze informacje

Z.ai. „GLM-5.2 (wagi modelu).” Hugging Face. huggingface.co/zai-org/GLM-5.2
VentureBeat. „Z.ai open-weights GLM-5.2 beats GPT-5.5 on coding benchmarks.” venturebeat.com
InfoWorld. „Z.ai pitches GLM-5.2 for long-running software engineering tasks.” infoworld.com
OpenRouter. „GLM 5.2 – API Pricing & Benchmarks.” openrouter.ai/z-ai/glm-5.2

GLM-5.2: chiński model open-source, który depcze po piętach Opusowi 4.8