Google dodał Lyria 3 do Gemini do generowania muzyki

Autor: Russell Thompson | dzisiaj, 18:20

Google ogłosił uruchomienie funkcji generowania muzyki w aplikacji Gemini. Nowa funkcja działa w oparciu o model Lyria 3, opracowany przez Google DeepMind, i jest na razie dostępna w wersji beta. Użytkownik musi jedynie opisać, jaką kompozycję chce uzyskać — Gemini stworzy 30-sekundowy utwór i, jeśli to konieczne, wygeneruje tekst (lub stworzy wersję instrumentalną).

Co wiadomo

Funkcja jest ukierunkowana na „szybkie tworzenie” muzyki do konkretnych zadań: można poprosić o utwór w określonym gatunku, nastroju i tempie, a także zarządzać poszczególnymi parametrami — stylem, wokalem i rytmem. Dodatkowo Gemini potrafi przyjmować nie tylko tekst: jeśli załadujesz zdjęcie lub wideo, system spróbuje dopasować dźwięk do „nastroju” pliku. Okładkę dla utworu generuje model Nano Banana.

Google osobno podkreśla ograniczenia dotyczące praw autorskich: Lyria 3 jest przeznaczona do oryginalnej twórczości, a nie do bezpośredniego kopiowania konkretnych wykonawców. Jeśli w zapytaniu podasz imię artysty, Gemini interpretuje to jako ogólną „twórczą wskazówkę” i tworzy utwór o podobnym klimacie, przy czym wykorzystuje filtry kontrolujące wyniki pod kątem zbieżności z istniejącą treścią.

Do oznaczania treści AI stosuje się znak wodny SynthID: wygenerowana muzyka otrzymuje oznaczenie, a w Gemini dodaje się także możliwość sprawdzenia, czy załadowany utwór został stworzony przez AI. Funkcja jest rozwijana na całym świecie dla użytkowników 18+ i obsługuje kilka języków (w tym angielski, niemiecki, hiszpański, francuski, hindi, japoński, koreański i portugalski).

Jednocześnie Google rozszerza dostęp do Lyria 3 dla twórców YouTube poprzez narzędzie Dream Track: wcześniej było dostępne w ograniczonym zakresie, teraz zapowiedziano rozszerzenie na inne kraje.

Źródło: Google