Meta zaktualizowała tłumacza AI SeamlessM4T, czyniąc go płynniejszym i bardziej ekspresyjnym
Meta
Meta zaprezentowała drugą wersję multimodalnej sieci neuronowej SeamlessM4T do tłumaczenia mowy. Aktualizacja sprawia, że tłumaczenie jest bardziej spontaniczne i emocjonalne.
Co wiadomo
Pierwsza nowa funkcja, SeamlessExpressive, przenosi intonację oryginalnego dźwięku do tłumaczenia: głośność, wysokość, tempo, pauzy itp. Nadaje to rozmowie bardziej naturalny charakter.
Druga funkcja, SeamlessStreaming, rozpoczyna tłumaczenie, gdy rozmówca wciąż mówi. Zmniejsza to opóźnienie do dwóch sekund i nie trzeba czekać, aż rozmówca skończy frazę.
Według Meta, algorytm analizuje część zdania, która została już wypowiedziana i decyduje, czy istnieje wystarczający kontekst, aby rozpocząć tłumaczenie.
Firma nie podała jeszcze dokładnego harmonogramu, kiedy nowe funkcje zostaną udostępnione szerszej publiczności.
Dla tych, którzy chcą dowiedzieć się więcej:
Źródło: Meta