OpenAI zaprezentowało narzędzie do klonowania głosu

01.04.2024, 16:32

Mariia Shalabaieva/Unsplash

OpenAI zaprezentowało Voice Engine, narzędzie do klonowania głosu, które może zasadniczo powielać czyjąś mowę na podstawie 15-sekundowej próbki audio.

Co wiadomo

Voice Engine opiera się na istniejącym interfejsie API zamiany tekstu na mowę i jest rozwijany od 2022 roku. OpenAI korzysta już z wersji tego zestawu narzędzi do pracy z gotowymi głosami.

Technologia ta może znaleźć zastosowanie w takich obszarach, jak czytanie na głos, tłumaczenie języków i pomoc osobom z zaburzeniami mowy. Jako przykład, OpenAI opisało pilotażowy projekt na Uniwersytecie Browna, w którym klon silnika głosowego został stworzony dla pacjenta z zaburzeniami mowy na podstawie wcześniej nagranego dźwięku.

Pomimo potencjalnych korzyści, istnieją obawy dotyczące potencjalnego niewłaściwego wykorzystania technologii do tworzenia fałszywych treści audio. W związku z tym OpenAI nie jest jeszcze gotowe do pełnego publicznego wydania Voice Engine i koncentruje się na rozwiązywaniu problemów związanych z prywatnością i bezpieczeństwem.

Firma twierdzi, że uwzględnia opinie partnerów z różnych branż, w tym rządu, mediów i społeczeństwa obywatelskiego, aby zapewnić bezpieczne wprowadzenie produktu na rynek. Wszyscy uczestnicy testów wstępnych muszą przestrzegać zasad użytkowania, które zabraniają podszywania się pod inną osobę bez zgody.

OpenAI wdraża również środki bezpieczeństwa, takie jak znak wodny do śledzenia pochodzenia dźwięku, proaktywne monitorowanie wykorzystania systemu i tworzenie "listy zakazanych głosów", aby zapobiec klonowaniu znanych osobowości.

Cena i kiedy się spodziewać

Dokładne oficjalne daty premiery i ostateczne ceny nie zostały jeszcze ogłoszone. Według TechCrunch, Voice Engine może kosztować 15 dolarów za milion znaków, co czyni go bardziej przyjazną dla budżetu opcją w porównaniu do konkurencji. Wspomniano również o wersji "HD" z wyższą ceną.

Źródło: Engadget