Google wprowadza Gemini 3.5 Live Translate: Rewolucyjny tłumacz audio w czasie rzeczywistym dla ponad 70 języków!
Google ogłosiło wydanie Gemini 3.5 Live Translate — zaawansowanego modelu audio przeznaczonego do tłumaczenia mowy w czasie zbliżonym do rzeczywistego.
Co wiadomo
Model rozpoznaje ponad 70 języków i zapewnia tłumaczenie bez potrzeby ręcznego dostosowywania ustawień, co pozwala na korzystanie z ponad 2000 kombinacji językowych bez marnowania czasu. W przeciwieństwie do systemów działających na zasadzie naprzemiennych replik (turn-by-turn), Gemini 3.5 Live tłumaczy mowę w sposób ciągły podczas transmisji strumieniowej, opóźniając się od mówcy tylko o kilka sekund. Przy tym zachowuje się intonacje, tempo i wysokość głosu mówcy.
Model stabilnie działa w głośnym i nieprzygotowanym otoczeniu, radząc sobie z hałasem w tle i nakładającymi się głosami.
Google zadbało o bezpieczeństwo i cała ścieżka dźwiękowa generowana przez model jest oznaczana niewidocznymi znakami wodnymi SynthID w celu zapobiegania dezinformacji.
Gdzie i kiedy pojawi się technologia
Dla deweloperów: Od 9 czerwca 2026 roku dostępna w trybie public preview poprzez Gemini Live API oraz Google AI Studio. Zewnętrzne platformy (Agora, Fishjam, LiveKit, Pipecat i Vision Agents) już wdrażają tę technologię. Partner Google — firma Grab — testuje model do komunikacji między kierowcami a pasażerami.
Dla klientów korporacyjnych (Google Meet): Od czerwca 2026 roku uruchamiane jest zamknięte preview dla wybranych użytkowników biznesowych Google Workspace. Pełna implementacja planowana jest na później w tym roku. Limit dostępnych języków rozszerzy się z 5 do ponad 70, zniknie ograniczenie tłumaczenia tylko z/na angielski.
Dla zwykłych użytkowników (Google Translate): Rozpoczyna się globalne wdrażanie w aplikacji Google Translate na Android i iOS. Podczas korzystania z funkcji Live translate z słuchawkami tłumaczenie jest transmitowane z zachowaniem tonu mówcy.
Tryb „Słuchania” (Listening mode): Uruchamiany dla użytkowników Androida. Funkcja pozwala słuchać tłumaczenia bezpośrednio przez głośnik telefonu — wystarczy zbliżyć go do ucha, jak przy zwykłym połączeniu, aby usłyszeć tłumaczenie poufnie bez słuchawek.
Źródło: Google Blog