Google udostępnia do testów zaktualizowaną, eksperymentalną wersję Gemini 2.0 Flash Thinking

W grudniu Google ogłosiło model Gemini 2.0 Flash Thinking jako pierwszy dla logicznego rozumowania, a teraz jego zaktualizowana wersja eksperymentalna jest dostępna do testowania.
Co wiemy.
Model ten opiera się na wersji Flash 2.0, która została wprowadzona wcześniej w tym samym miesiącu i pozwala "wyraźnie pokazać swoje rozumowanie" (jak w AI Studio). Poprawia to wydajność podczas rozwiązywania bardziej złożonych problemów. Uzupełnia on inne modele, takie jak gemini-2.0-flash-exp i gemini-exp-1206.
Włączyliśmy również wykonywanie kodu jako narzędzie, dzięki czemu model może zdecydować o napisaniu i wykonaniu kodu podczas swojej odpowiedzi.
- Jack Rae (@jack_w_rae) 21 stycznia 2025 r.
Możesz to włączyć na pasku bocznym w AI Studio! Oto zabawny przykład, w którym model oblicza rozwiązanie za pomocą formuły, ale pisze kod Pythona, aby uzyskać...pic.twitter.com/j8wNp8Yn27
Główne cechy Gemini 2.0 Flash Thinking Experimental (styczeń 2025)
- Okno kontekstowe z 1 milionem tokenów (z 32 tys.): jest to wygodne dla tych, którzy chcą "podłączyć bazę kodu lub poprosić o zestaw artykułów z bardziej złożonym rozumowaniem".
- Wsparcie dla wykonywania kodu na miejscu: dla lepszego wykorzystania narzędzia.
- Generowanie większej liczby tokenów wyjściowych.
- Niższa częstotliwość rozbieżności w modelu ("zmniejszone prawdopodobieństwo sprzeczności między opinią a odpowiedzią").
- W porównaniu do Exp 1219, nowa wersja wykazuje "lepszą wydajność w testach matematycznych, przyrodniczych i multimodalnych", w tym 73,3% w teście AIME2024 (matematyka) i 74,2% w teście GPQA Diamond (nauka).
Kolejna wersja naszej serii modeli myślenia + wykonanie kodu + kontekst tokena 1M! Postęp w skalowaniu myślenia jest niesamowity i będzie kontynuowany - dostępny w Google AI Studio! Więcej na https://t.co/OFacvvK8d9
- Sundar Pichai (@sundarpichai) 21 stycznia 2025 r.
Dyrektor generalny DeepMind, Demis Hasabis, zauważył, że "stanowi to bardzo szybki postęp od czasu naszej pierwszej wersji w grudniu". Zauważono, że rozwijają takie systemy planowania od ponad dekady, zaczynając od programów takich jak AlphaGo, i cieszą się, że widzą potężne połączenie tych pomysłów z najpotężniejszymi podstawowymi modelami.
Gemini 2.0 Flash Thinking Experimental jest dostępny do bezpłatnego testowania w Google AI Studio i za pośrednictwem API. Sundar Pichai zauważył, że postęp w skalowaniu rozumowania jest imponujący i będzie kontynuowany, i obiecał więcej wiadomości w przyszłości.
Źródło: 9to5Google