Google udostępnia do testów zaktualizowaną, eksperymentalną wersję Gemini 2.0 Flash Thinking

22.01.2025, 13:46

W grudniu Google ogłosiło model Gemini 2.0 Flash Thinking jako pierwszy dla logicznego rozumowania, a teraz jego zaktualizowana wersja eksperymentalna jest dostępna do testowania.

Co wiemy.

Model ten opiera się na wersji Flash 2.0, która została wprowadzona wcześniej w tym samym miesiącu i pozwala "wyraźnie pokazać swoje rozumowanie" (jak w AI Studio). Poprawia to wydajność podczas rozwiązywania bardziej złożonych problemów. Uzupełnia on inne modele, takie jak gemini-2.0-flash-exp i gemini-exp-1206.

Włączyliśmy również wykonywanie kodu jako narzędzie, dzięki czemu model może zdecydować o napisaniu i wykonaniu kodu podczas swojej odpowiedzi.

Możesz to włączyć na pasku bocznym w AI Studio! Oto zabawny przykład, w którym model oblicza rozwiązanie za pomocą formuły, ale pisze kod Pythona, aby uzyskać...pic.twitter.com/j8wNp8Yn27
- Jack Rae (@jack_w_rae) 21 stycznia 2025 r.

Główne cechy Gemini 2.0 Flash Thinking Experimental (styczeń 2025)

Okno kontekstowe z 1 milionem tokenów (z 32 tys.): jest to wygodne dla tych, którzy chcą "podłączyć bazę kodu lub poprosić o zestaw artykułów z bardziej złożonym rozumowaniem".
Wsparcie dla wykonywania kodu na miejscu: dla lepszego wykorzystania narzędzia.
Generowanie większej liczby tokenów wyjściowych.
Niższa częstotliwość rozbieżności w modelu ("zmniejszone prawdopodobieństwo sprzeczności między opinią a odpowiedzią").
W porównaniu do Exp 1219, nowa wersja wykazuje "lepszą wydajność w testach matematycznych, przyrodniczych i multimodalnych", w tym 73,3% w teście AIME2024 (matematyka) i 74,2% w teście GPQA Diamond (nauka).

Kolejna wersja naszej serii modeli myślenia + wykonanie kodu + kontekst tokena 1M! Postęp w skalowaniu myślenia jest niesamowity i będzie kontynuowany - dostępny w Google AI Studio! Więcej na https://t.co/OFacvvK8d9
- Sundar Pichai (@sundarpichai) 21 stycznia 2025 r.

Dyrektor generalny DeepMind, Demis Hasabis, zauważył, że "stanowi to bardzo szybki postęp od czasu naszej pierwszej wersji w grudniu". Zauważono, że rozwijają takie systemy planowania od ponad dekady, zaczynając od programów takich jak AlphaGo, i cieszą się, że widzą potężne połączenie tych pomysłów z najpotężniejszymi podstawowymi modelami.

Gemini 2.0 Flash Thinking Experimental jest dostępny do bezpłatnego testowania w Google AI Studio i za pośrednictwem API. Sundar Pichai zauważył, że postęp w skalowaniu rozumowania jest imponujący i będzie kontynuowany, i obiecał więcej wiadomości w przyszłości.

Źródło: 9to5Google