Google udostępnia do testów zaktualizowaną, eksperymentalną wersję Gemini 2.0 Flash Thinking
W grudniu Google ogłosiło model Gemini 2.0 Flash Thinking jako pierwszy dla logicznego rozumowania, a teraz jego zaktualizowana wersja eksperymentalna jest dostępna do testowania.
Co wiemy.
Model ten opiera się na wersji Flash 2.0, która została wprowadzona wcześniej w tym samym miesiącu i pozwala "wyraźnie pokazać swoje rozumowanie" (jak w AI Studio). Poprawia to wydajność podczas rozwiązywania bardziej złożonych problemów. Uzupełnia on inne modele, takie jak gemini-2.0-flash-exp i gemini-exp-1206.
Główne cechy Gemini 2.0 Flash Thinking Experimental (styczeń 2025)
- Okno kontekstowe z 1 milionem tokenów (z 32 tys.): jest to wygodne dla tych, którzy chcą "podłączyć bazę kodu lub poprosić o zestaw artykułów z bardziej złożonym rozumowaniem".
- Wsparcie dla wykonywania kodu na miejscu: dla lepszego wykorzystania narzędzia.
- Generowanie większej liczby tokenów wyjściowych.
- Niższa częstotliwość rozbieżności w modelu ("zmniejszone prawdopodobieństwo sprzeczności między opinią a odpowiedzią").
- W porównaniu do Exp 1219, nowa wersja wykazuje "lepszą wydajność w testach matematycznych, przyrodniczych i multimodalnych", w tym 73,3% w teście AIME2024 (matematyka) i 74,2% w teście GPQA Diamond (nauka).
Dyrektor generalny DeepMind, Demis Hasabis, zauważył, że "stanowi to bardzo szybki postęp od czasu naszej pierwszej wersji w grudniu". Zauważono, że rozwijają takie systemy planowania od ponad dekady, zaczynając od programów takich jak AlphaGo, i cieszą się, że widzą potężne połączenie tych pomysłów z najpotężniejszymi podstawowymi modelami.
Gemini 2.0 Flash Thinking Experimental jest dostępny do bezpłatnego testowania w Google AI Studio i za pośrednictwem API. Sundar Pichai zauważył, że postęp w skalowaniu rozumowania jest imponujący i będzie kontynuowany, i obiecał więcej wiadomości w przyszłości.
Źródło: 9to5Google