Microsoft zaprezentował dipfake i narzędzia do klonowania głosu


Microsoft

Na konferencji Ignite Microsoft ogłosił usługę tworzenia fotorealistycznych awatarów ludzi z animacją ust według zadanego tekstu. Pokazał również narzędzie do klonowania głosu na podstawie próbki audio.

Co wiadomo

Nowa usługa Azure AI Speech text to speech avatar umożliwia przesłanie zdjęcia osoby i skomponowanie skryptu. Na tej podstawie generowane jest wideo z mówiącym awatarem.

Cyfrowe sobowtóry mogą mówić w kilku językach. W skryptach mogą korzystać z modeli sztucznej inteligencji, takich jak GPT-3.5 firmy OpenAI, aby odpowiadać na pytania klientów poza skryptami.

Inna funkcja Personal Voice może odtworzyć głos użytkownika w ciągu kilku sekund. Wymaga to jednominutowego nagrania audio.

Firma sugeruje wykorzystanie Personal voice do tworzenia spersonalizowanych asystentów głosowych, dubbingowania treści na różne języki i tworzenia niestandardowych narracji dla opowiadań, audiobooków i podcastów.

Według Microsoftu oba narzędzia będą dostępne dla ograniczonej liczby użytkowników i tylko w określonych scenariuszach. Ponadto klienci muszą wyrazić wyraźną zgodę na wykorzystanie ich głosu i wizerunku.

Ma to na celu ograniczenie potencjalnego niewłaściwego wykorzystania technologii do tworzenia podróbek bez wiedzy ludzi. Microsoft twierdzi, że przyjmuje odpowiedzialne podejście do etyki sztucznej inteligencji.

Źródło: Microsoft, Microsoft

var _paq = window._paq = window._paq || []; _paq.push(['trackPageView']); _paq.push(['enableLinkTracking']); (function() { var u='//mm.magnet.kiev.ua/'; _paq.push(['setTrackerUrl', u+'matomo.php']); _paq.push(['setSiteId', '2']); var d=document, g=d.createElement('script'), s=d.getElementsByTagName('script')[0]; g.async=true; g.src=u+'matomo.js'; s.parentNode.insertBefore(g,s); })();