OpenAI testuje nowe modele GPT-5.6: Sol, Terra i Luna - co sprawia, że są wyjątkowe?

Autor: Anton Kratiuk | dzisiaj, 12:06

OpenAI rozpoczyna ograniczone testowanie nowej serii modeli sztucznej inteligencji — GPT-5.6. Obejmuje ona trzy wersje do różnych zadań:

  • Sol — flagowy, najpotężniejszy i najinteligentniejszy model;
  • Terra — zrównoważona wersja do codziennych zadań (działa na poziomie wcześniejszych flagowców, ale jest dwukrotnie tańsza);
  • Luna — najszybszy i najbardziej przystępny cenowo model — jeden milion tokenów na wejściu kosztuje 4 PLN (1 USD), a na wyjściu 22 PLN (6 USD).

Co wiadomo

W wersji Sol pojawi się nowy tryb maksymalnego zrozumienia (max reasoning effort), który daje sieci neuronowej więcej czasu na przemyślenie skomplikowanych zadań, a także tryb „ultra”, przyciągający wirtualnych asystentów (subagentów) do przyspieszenia pracy. Deweloper twierdzi, że Sol najlepiej sprawdza się w zadaniach związanych z biologią, a w benchmarku TerminalBench 2.1 sieć neuronowa wykazała się nieco lepszą wydajnością niż głośny Claude Mythos 5 od Anthropic. Nawiasem mówiąc, Terra w TerminalBench 2.1 uzyskała taki sam wynik jak Claude Fable 5.

Modele stały się znacznie lepsze w pisaniu kodu, rozwiązywaniu zadań z dziedziny nauk przyrodniczych i cyberbezpieczeństwa, przy jednoczesnym mniejszym zużyciu zasobów i bardziej efektywnej pracy w porównaniu do poprzednich wersji.

OpenAI wdrożyło wiele poziomów ochrony. Sieć neuronowa została przeszkolona do wykrywania prób oszustwa (jailbreaków), a specjalny filtr sprawdza odpowiedzi w czasie rzeczywistym. Jeśli system zauważy coś podejrzanego, generowanie zostanie wstrzymane na czas dodatkowej weryfikacji. Z tego powodu podczas testów użytkownicy mogą doświadczać opóźnień lub fałszywych blokad.

Aby znaleźć luki w kodzie zabezpieczeń, OpenAI używało innych sieci neuronowych, które nieprzerwanie atakowały nowy model przez setki tysięcy godzin, pomagając wyeliminować słabości przed wydaniem. W rezultacie znaleziono luki i firma Sama Altmana twierdzi, że jest pewna bezpieczeństwa systemu.

Dodatkowo, OpenAI ogłosiło również tryby Max i Ultra, które jeszcze bardziej zwiększają efektywność GPT-5.6 dzięki wykorzystaniu dodatkowych agentów AI przy przetwarzaniu zapytań.

Kiedy się spodziewać

Obecnie dostęp do GPT-5.6 jest otwarty w trybie zamkniętego podglądu dla wąskiego grona zaufanych partnerów i organizacji (w porozumieniu z rządem USA do sprawdzenia bezpieczeństwa).

W ciągu najbliższych tygodni OpenAI planuje udostępnić model Sol, Terra i Luna wszystkim użytkownikom poprzez ChatGPT i API.

Źródło: OpenAI