Meta zaktualizowała tłumacza AI SeamlessM4T, czyniąc go płynniejszym i bardziej ekspresyjnym


Meta

Meta zaprezentowała drugą wersję multimodalnej sieci neuronowej SeamlessM4T do tłumaczenia mowy. Aktualizacja sprawia, że tłumaczenie jest bardziej spontaniczne i emocjonalne.

Co wiadomo

Pierwsza nowa funkcja, SeamlessExpressive, przenosi intonację oryginalnego dźwięku do tłumaczenia: głośność, wysokość, tempo, pauzy itp. Nadaje to rozmowie bardziej naturalny charakter.

Druga funkcja, SeamlessStreaming, rozpoczyna tłumaczenie, gdy rozmówca wciąż mówi. Zmniejsza to opóźnienie do dwóch sekund i nie trzeba czekać, aż rozmówca skończy frazę.

Według Meta, algorytm analizuje część zdania, która została już wypowiedziana i decyduje, czy istnieje wystarczający kontekst, aby rozpocząć tłumaczenie.

Firma nie podała jeszcze dokładnego harmonogramu, kiedy nowe funkcje zostaną udostępnione szerszej publiczności.

Dla tych, którzy chcą dowiedzieć się więcej:

Źródło: Meta

var _paq = window._paq = window._paq || []; _paq.push(['trackPageView']); _paq.push(['enableLinkTracking']); (function() { var u='//mm.magnet.kiev.ua/'; _paq.push(['setTrackerUrl', u+'matomo.php']); _paq.push(['setSiteId', '2']); var d=document, g=d.createElement('script'), s=d.getElementsByTagName('script')[0]; g.async=true; g.src=u+'matomo.js'; s.parentNode.insertBefore(g,s); })();