Fugatto: NVIDIA prezentuje potężne narzędzie do generowania wideo

Autor: Anry Sergeev | 25.11.2024, 19:05
Fugatto: NVIDIA prezentuje potężne narzędzie do generowania wideo

NVIDIA zaprezentowała Fugatto (Foundational Generative Audio Transformer Opus 1), uniwersalny model generatywnej sztucznej inteligencji zdolny do tworzenia i przekształcania muzyki, głosów i dźwięków na podstawie tekstu lub żądań audio. Firma nazwała to rozwiązanie "szwajcarskim scyzorykiem dla dźwięku".


Wideo: demonstracja NVIDIA Fugatto

Co wiadomo

Fugatto jest wyjątkowy, ponieważ łączy w sobie możliwości wcześniej wykonywane przez oddzielne modele. Jest w stanie wykonywać złożone zadania, takie jak

  • Generowanie muzyki z tekstu: Przykładowo, model może stworzyć "melancholijną kompozycję fortepianową z lekkim jazzowym rytmem".
  • Transformacja dźwięku: Można zmienić instrument w utworze, powiedzmy zamienić gitarę w wiolonczelę lub dodać perkusję do istniejącej melodii.
  • Modyfikacja głosu: Model może dostosować emocjonalny ton głosu, a nawet zmienić jego akcenty.
  • Szczególną cechą Fugatto jest możliwość syntetyzowania dźwięków, które jeszcze nie istniały. Na przykład, może stworzyć unikalny hałas, który byłby odpowiedni dla konkretnego filmu lub gry.

Dlaczego to ważne.

Rozwój NVIDIA wyznacza nowe standardy generatywnej sztucznej inteligencji w audio. Dzięki Fugatto kreatywni profesjonaliści otrzymują narzędzie, które nie tylko automatyzuje rutynowe procesy, ale także zapewnia nieskończone możliwości kreatywności. Zdolność Fugatto do dostosowania się do wielu scenariuszy oznacza, że w przyszłości model ten może znaleźć zastosowanie w obszarach, w których dźwięk ma kluczowe znaczenie, od reklamy po programy edukacyjne.

Technologia ta potwierdza również trend modeli AI zmierzających w kierunku wielozadaniowości. Wcześniej do różnych zadań potrzebne były oddzielne modele, ale teraz Fugatto pokazuje, że wielofunkcyjne rozwiązania są nie tylko możliwe, ale i skuteczne.

Co kryje się za słowem Fugatto?

Oczywiście pochodzi ono od słowa "fuga". Fuga to forma muzyczna i technika kompozytorska charakteryzująca się polifoniczną strukturą, w której jeden lub więcej tematów (melodii) jest powtarzanych i rozwijanych w różnych głosach. Termin ten pochodzi od łacińskiego słowa fuga, oznaczającego "bieg" lub "ucieczkę", co odzwierciedla ideę tematu "biegnącego" z jednego głosu do drugiego. Fuga stała się głównym gatunkiem w muzyce barokowej, zwłaszcza dzięki kompozytorom takim jak Johann Sebastian Bach, który jest uważany za jednego z największych mistrzów tego gatunku.

Słowo "fugatto" (włoskie: fugato) oznacza polifoniczną formę muzyczną, która jest związana z fugą. Fugatto wywodzi się z dzieł o surowym stylu i obejmuje technikę imitacji, w której jeden lub więcej tematów jest powtarzanych i rozwijanych w różnych głosach.

Źródło: blogs.nvidia.com