Google udostępnia do testów zaktualizowaną, eksperymentalną wersję Gemini 2.0 Flash Thinking

Autor: Nastya Bobkova | 22.01.2025, 13:35

W grudniu Google ogłosiło model Gemini 2.0 Flash Thinking jako pierwszy dla logicznego rozumowania, a teraz jego zaktualizowana wersja eksperymentalna jest dostępna do testowania.

Co wiemy.

Model ten opiera się na wersji Flash 2.0, która została wprowadzona wcześniej w tym samym miesiącu i pozwala "wyraźnie pokazać swoje rozumowanie" (jak w AI Studio). Poprawia to wydajność podczas rozwiązywania bardziej złożonych problemów. Uzupełnia on inne modele, takie jak gemini-2.0-flash-exp i gemini-exp-1206.

Główne cechy Gemini 2.0 Flash Thinking Experimental (styczeń 2025)

Okno kontekstowe z 1 milionem tokenów (z 32 tys.): jest to wygodne dla tych, którzy chcą "podłączyć bazę kodu lub poprosić o zestaw artykułów z bardziej złożonym rozumowaniem".
Wsparcie dla wykonywania kodu na miejscu: dla lepszego wykorzystania narzędzia.
Generowanie większej liczby tokenów wyjściowych.
Niższa częstotliwość rozbieżności w modelu ("zmniejszone prawdopodobieństwo sprzeczności między opinią a odpowiedzią").
W porównaniu do Exp 1219, nowa wersja wykazuje "lepszą wydajność w testach matematycznych, przyrodniczych i multimodalnych", w tym 73,3% w teście AIME2024 (matematyka) i 74,2% w teście GPQA Diamond (nauka).

Dyrektor generalny DeepMind, Demis Hasabis, zauważył, że "stanowi to bardzo szybki postęp od czasu naszej pierwszej wersji w grudniu". Zauważono, że rozwijają takie systemy planowania od ponad dekady, zaczynając od programów takich jak AlphaGo, i cieszą się, że widzą potężne połączenie tych pomysłów z najpotężniejszymi podstawowymi modelami.

Gemini 2.0 Flash Thinking Experimental jest dostępny do bezpłatnego testowania w Google AI Studio i za pośrednictwem API. Sundar Pichai zauważył, że postęp w skalowaniu rozumowania jest imponujący i będzie kontynuowany, i obiecał więcej wiadomości w przyszłości.

Źródło: 9to5Google