Meta udostępniła generator dźwięków i piosenek AI firmy AudioCraft i otworzyła jego kod źródłowy

Autor: Bohdan Kaminskyi | 03.08.2023, 12:59
Meta udostępniła generator dźwięków i piosenek AI firmy AudioCraft i otworzyła jego kod źródłowy

Meta wydała AudioCraft, narzędzie AI o otwartym kodzie źródłowym, które generuje muzykę i dźwięki na podstawie wskazówek tekstowych.

Co wiadomo

AudioCraft składa się z trzech modeli sztucznej inteligencji, z których każdy rozwiązuje różne problemy związane z generowaniem dźwięku:

  • MusicGen tworzy muzykę. Został on przeszkolony na 20 000 godzin muzyki należącej do Meta lub licencjonowanej specjalnie w tym celu;
  • AudioGen generuje dźwięki imitując szczekanie psów lub odgłosy kroków. Model został wytrenowany na nagraniach zebranych w miejscach publicznych;
  • dekoder EnCodec umożliwia tworzenie dźwięków z mniejszą liczbą artefaktów.

Meta wierzy, że AudioCraft ma potencjał, by wywołać nową falę piosenek, podobnie jak kiedyś syntezatory zmieniły muzykę. Firma otworzyła również kod źródłowy narzędzia, aby zdywersyfikować dane wykorzystywane do jego szkolenia.

Próbek muzyki i dźwięków stworzonych przez AudioCraft można posłuchać na stronie internetowej projektu. Kod źródłowy narzędzia jest dostępny na GitHub.

Źródło: Meta AI